Apple presenta una nueva útil de imágenes con IA para editar fotos mediante mensajes de texto

Índice
  1. Que quieres saber
  2. Los deepfakes de IA siguen siendo un problema

Que quieres saber

  • Los investigadores de Apple han presentado una nueva herramienta de imágenes de IA que permite a los usuarios editar imágenes mediante indicaciones de texto.
  • La herramienta de edición de imágenes guiada por MLLM (MGIE) puede cambiar el tamaño, voltear, recortar e incluso agregar filtros a las imágenes mediante mensajes de texto.
  • Puedes descargarlo en GitHub, aunque Apple no ha anunciado directamente sus planes para el modelo.

Con la rápida adopción de la tecnología de IA generativa, están surgiendo cada vez más herramientas de generación de imágenes como Microsoft Image Creator by Designer (anteriormente Bing Image Creator), Midjourney y muchas otras. Como usuario ávido de estas plantillas, me resulta molesto que no exista una forma rápida de editar una imagen que ya has generado.

Google está en camino de resolver este problema con su herramienta experimental de generación de imágenes, ImageFX. Lo que lo distingue de los demás es que más allá de generar imágenes usando indicaciones, permite a los usuarios editar las indicaciones usando viñetas expresivas, lo que facilita el refinamiento del resultado.

Y ahora Apple parece haberse unido a la refriega con un nuevo modelo impulsado por IA que permite a los usuarios describir qué ediciones quieren hacer en una foto sin tener que navegar por el software. El modelo de edición de imágenes guiada por MLLM (MGIE) puede cambiar el tamaño, voltear, recortar e incluso agregar filtros a las imágenes mediante mensajes de texto.

El modelo MGIE interpreta el mensaje y luego "imagina" los cambios descritos por el usuario antes de aplicarlos en tiempo real. En el trabajo de investigación, los investigadores utilizaron una foto de una pizza de pepperoni y el mensaje "hazla más saludable" como instrucciones para los cambios que querían hacer en la foto. Por eso, la modelo añadió verduras a la pizza de pepperoni.

Según los investigadores:

"En lugar de una guía breve pero ambigua, MGIE deriva una intención visual explícita y conduce a una edición de imágenes razonable. Realizamos estudios extensos sobre varios aspectos de la edición y demostramos que nuestro MGIE mejora efectivamente el rendimiento mientras mantiene una eficiencia competitiva. También creemos que MLLM es guiado por Este marco puede contribuir a futuras investigaciones sobre la visión y el lenguaje.

El nuevo modelo de IA de Apple te permite editar fotos usando un mensaje (Crédito de la imagen: Apple)

Es fantástico ver un modelo de IA con esta característica tan necesaria que potencialmente hará que la generación de imágenes sea más fácil y rápida.

Los deepfakes de IA siguen siendo un problema

(Crédito de la imagen: Mikhail Parakhin en Twitter)

Generar imágenes usando IA es simplemente un juego divertido hasta que la gente comienza a usar la tecnología para crear imágenes falsas y contenido explícito. La estrella del pop Taylor Swift recientemente apareció en los titulares después de que aparecieran en las redes sociales imágenes explícitas de ella, presumiblemente generadas con Microsoft Designer.

Vale la pena señalar que Microsoft Designer se ha actualizado con nuevas regulaciones y medidas de seguridad que impiden a los usuarios generar contenido explícito utilizando la herramienta. Esto se suma a la Ley DEFIANCE (Interrupción de imágenes falsificadas explícitas y ediciones no consensuales) recientemente impuesta, diseñada para regular y prevenir tales eventos.

Aunque las barreras de seguridad y la censura reducen en gran medida las posibilidades de que tal evento vuelva a ocurrir, los usuarios se han quejado de que algunas de estas medidas son excesivas y aparentemente han dejado herramientas como Designer's Image Creator lobotomizadas.

En el pasado, hemos visto a varios usuarios engañar a los chatbots de IA para que realicen tareas restringidas. Por ejemplo, cuando un usuario engañó a ChatGPT para que generara claves de Windows. Por lo tanto, los investigadores de Apple deben investigar este tema en profundidad para llenar todos los vacíos.

Más allá de la investigación, aún no está claro cuáles son los planes de Apple para MGIE, aunque el modelo está disponible para descargar en GitHub. Apple ha estado relativamente tranquila en el panorama de la IA, pero desde principios de año ha logrado avances sutiles y se ha familiarizado con la tecnología. Por otro lado, Microsoft está en gran forma, ya que tomó una temprana ventaja en el espacio de la IA al invertir varios miles de millones de dólares, lo que ahora la coloca en la cima de la lista de las empresas más valiosas del mundo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir