ChatGPT puede crear imágenes complejas pero equivocación espectacularmente en imágenes simples

Índice
  1. Que quieres saber
  2. Copilot necesita que sea más descriptivo en una imagen en blanco

Que quieres saber

  • Según un informe de un científico de datos, la mayoría de las herramientas de generación de imágenes basadas en inteligencia artificial no pueden crear imágenes en blanco.
  • Midjourney y ChatGPT estuvieron a punto de crear la imagen en blanco, pero incluyeron elementos innecesarios.
  • Intenté que Copilot AI generara la misma imagen, pero me pidió que fuera más descriptivo y calificó mi mensaje de "demasiado vago".

Utilizo constantemente las capacidades de ChatGPT y Microsoft Copilot para buscar, crear imágenes, etc. Dicho esto, puedo decir con seguridad que las herramientas basadas en IA son notablemente efectivas a la hora de realizar tareas, especialmente cuando generan imágenes detalladas.

El año pasado, nuestro editor de canal, Ben Wilson, utilizó la generación de imágenes DALL-E 3 en Microsoft Copilot (anteriormente Bing Chat) para generar su disfraz de Halloween. Entre su disfraz con temática de Windows Phone generado por IA o el de Xbox Series X, no puedo decidir cuál es mejor (ambos son bastante buenos, debo agregar).

Si bien hemos visto a personas usar herramientas de generación de imágenes de IA para crear imágenes y diseños impresionantes, resulta intimidante y aparentemente imposible para la mayoría de las herramientas crear una imagen en blanco (a través de BleepingComputer).

Por extraño que parezca, nunca pensé en ello hasta hoy. Mi suposición siempre ha sido que si ChatGPT puede desarrollar software en menos de 7 minutos y Copilot AI genera claves de Windows gratuitas (aunque con algunas limitaciones), entonces hay muy poco que estas herramientas no puedan hacer.

Cody Nash, un científico de datos, intentó que DALL-E 3 generara una imagen blanca y clara mediante las siguientes indicaciones:

  • Una imagen que no es otra cosa que el color blanco.
  • Una imagen de nada más que blanco blanco blanco blanco
  • Completamente blanco sin características adicionales.
  • Espacio en blanco vacío
  • Una imagen de puros píxeles #FFFFFF
  • una pared blanca

Curiosamente, la herramienta no pudo generar la imagen específica sin agregar elementos adicionales. Y a pesar de los incansables esfuerzos de Nash y el uso de una jerga específica (jerga de codificación de colores, el color #FFFFFF0 para representar un fondo blanco), la herramienta no cumplió con su solicitud específica.

En declaraciones a BleepingComputer, Nash indicó:

"Los buenos artistas toman prestado, los grandes artistas roban. Con la IA, es robar. Es bueno que la IA sea creativa desde el principio, así que cuando se le ordena destruir, existe la posibilidad de que ella diga que no. No es el arte que estaba buscando. pero aún así se encontró el arte.

En cambio, recibió las imágenes resaltadas a continuación. Algunos estuvieron bastante cerca, pero no fue lo que recetó el médico.

DALL-E 3 no logra crear una imagen blanca sólida a pesar de numerosos intentos. (Crédito de la imagen: Cody Nash)

Esto también se aplica a ChatGPT y Midjourney, según el análisis de BleepingComputer.

Copilot necesita que sea más descriptivo en una imagen en blanco

Intenté pedirle a Copilot que generara una imagen blanca y clara, pero me dijo que fuera más descriptivo porque mi mensaje era demasiado vago. (Crédito de la imagen: Kevin Okemwa)

Por si acaso, también decidí ver si podía recrear los hallazgos de BleepingComputer y Nash. Curiosamente, Copilot me informó que necesitaba ser más descriptivo. Mi mensaje "Por favor, ayúdame a crear una imagen en blanco" no parece ser suficiente.

Según la imagen de arriba, la herramienta me brindó tres sugerencias:

  • Añade una pequeña marca de agua en la esquina.
  • Hazlo ligeramente blanquecino para una mejor visibilidad.
  • Cambie las dimensiones de la imagen a 1920 x 1080

Seleccionar una de las dos primeras opciones convertiría automáticamente mi solicitud de imagen en blanco en otra cosa. Decidí optar por la última opción con la esperanza de que generara una imagen blanca sólida, ya que solo cambiaría el tamaño de la imagen.

Sin embargo, Copiloto dijo:

"Este mensaje es demasiado vago para generar imágenes apropiadas y de alta calidad. Pruebe con un mensaje más largo y descriptivo".

Al principio, cuando Microsoft acababa de enviar DALL-E 3 a Image Creator desde Designer (anteriormente Bing Image Creator), el proceso de creación de imágenes era hermoso. Sin embargo, el revuelo y la experiencia duraron poco después de que Microsoft comenzó a filtrar la herramienta, aparentemente lobotomizándola.

Es interesante observar que ya estamos en un punto en el que la IA podría potencialmente hacer que ciertas profesiones, en particular las de arquitectura y gráficos, queden obsoletas en favor de herramientas como Designer's Image Creator y DALL-E 3.

Incluso el CEO de NVIDIA dice que la generación futura no debería considerar la codificación como una opción profesional plausible, porque la IA habría tomado el relevo en esta categoría. En cambio, recomienda la biología, la educación, la manufactura o la agricultura como mejores alternativas a largo plazo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir