Primer vistazo al DALL-E 3 de ChatGPT en Microsoft Bing Chat AI

Creador de imágenes de chat de Bing

PUNTOS CLAVE

  • Microsoft Bing Chat presenta DALL-E 3, una versión avanzada de la herramienta OpenAI que convierte descripciones de texto en imágenes detalladas. La versión actualizada está disponible para usuarios seleccionados.
  • DALL-E 3 mejora significativamente a DALL-E 2 al generar con precisión palabras, etiquetas y signos dentro de las imágenes.
  • OpenAI ha confirmado que DALL-E 3 estará disponible para los clientes pagos de su plataforma de IA en octubre. Sin embargo, Bing Chat ofrece las mismas funciones de creación de imágenes que DALL-E 3 de forma gratuita.

Microsoft Bing Chat está lanzando DALL-E 3, una versión actualizada de la herramienta de conversión de texto a imagen de OpenAI, para un "pequeño grupo de usuarios", según una fuente de la empresa.

La integración de DALL-E 3 basada en ChatGPT está disponible en una de nuestras cuentas de Microsoft para Bing Chat y funciona como se anuncia: puede convertir descripciones de imágenes en obras de arte con más detalles y texto. A diferencia del DALL-E 2, el nuevo DALL-E 3 es mucho mejor a la hora de crear obras de arte de alta calidad, gracias a la forma en que maneja el texto dentro de las imágenes.

DALL-E de OpenAI respaldado por Microsoft es como una caja mágica. Puedes decirle a la IA que dibuje cualquier imagen y creará una obra de arte única, pero el modelo de la generación anterior no era bueno para generar palabras, etiquetas y signos dentro de las imágenes. El nuevo modelo resuelve los problemas de generación de texto y OpenAI ahora puede producir etiquetas o señales con mayor precisión.

Por ejemplo, si le pide a Bing Chat AI que cree "una ilustración de un aguacate sentado en la silla de un terapeuta, diciendo 'Me siento tan vacío por dentro' con un agujero del tamaño de un hoyo en el centro". El terapeuta garabatea notas con una cuchara y puede producir el resultado con precisión. El texto dentro de la imagen, "Me siento tan vacío por dentro", también aparece correctamente.

Bing Chat con actualización DALL-E 3
Bing Chat con DALL-E 3 | Imagen cortesía: WindowsLatest.com

Como puede ver en la captura de pantalla anterior, DALL-E 3 maneja el texto dentro de las imágenes significativamente mejor que su predecesor. Mientras que DALL-E 2 produce ilustraciones con alfabetos aleatorios, el nuevo modelo de IA en Bing Chat renderizó la imagen con el texto exacto como se describe.

El “Me siento tan vacío por dentro” queda perfectamente impreso en la imagen.

Creador de imágenes de Bing Chat con DALL-E 3
Bing con DALL-E 2 a la izquierda VS Bing con DALL-E 3 a la derecha para recibir el mensaje: Una ilustración de un astronauta en el espacio volando alrededor de la luna. La luna contiene el texto "WindowsLatest.com".

No sabemos cuántos usuarios de Bing Chat tienen acceso a DALL-E 3, que ni siquiera está en ChatGPT todavía, pero una fuente de Microsoft nos dijo que el soporte se está implementando para un puñado de usuarios/cuentas.

Ayer, en una publicación de blog que anuncia la próxima generación de modelos de IA de texto a imagen, OpenAI confirmó que los clientes pagos de su plataforma de IA (ChatGPT Plus y Enterprise) podrán acceder a DALL-E 3 en octubre. Después de registrarte en ChatGPT Plus, puedes escribir mensajes directamente en ChatGPT y crear imágenes.

Sin embargo, si no puede esperar o no quiere pagar por ChatGPT Plus, puede utilizar el creador de imágenes DALL-E 3 de Bing Chat, que ofrece la misma funcionalidad de forma gratuita.

Si tiene acceso a la vista previa temprana de DALLE-3, debería poder probar el nuevo creador de imágenes en Bing Chat en Microsoft Edge Canary, que se actualizó recientemente con "Escritura AI en la Web" y la función Continuar en el teléfono de Bing.

Índice
  1. PUNTOS CLAVE
  • DALL-E es excepcionalmente mejor que los modelos anteriores
  • DALL-E es excepcionalmente mejor que los modelos anteriores

    El nuevo modelo de IA de texto a imagen ofrece numerosas mejoras de calidad con respecto a su predecesor, que no podía manejar etiquetas y señales, demandas de imágenes de alta calidad y más.

    Los detalles no están disponibles, pero al igual que con los modelos anteriores, DALL-E 3 en ChatGPT y Bing Chat se basa en datos obtenidos de millones de imágenes de creadores de Internet, fotógrafos, artistas, imágenes de archivo y más.

    “Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería oportuna. DALL·E 3 representa un gran avance en nuestra capacidad de generar imágenes que se adhieran con precisión al texto proporcionado”, señaló OpenAI en la publicación del blog.

    La diferencia clave entre el modelo nuevo y el antiguo es que DALL-E 3 se centra más en pequeños detalles como textos, objetos y más.

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir