Empresas de IA que buscan datos producidos por IA para entrenamiento recursivo

Parece que las empresas de IA como Microsoft, OpenAI y Cohere están haciendo todo lo posible para encontrar datos sintéticos con los que entrenar sus productos de IA. Citando la disponibilidad limitada de datos "orgánicos" generados por humanos en la World Wide Web, estas empresas pretenden utilizar datos (sintéticos) generados por IA en una especie de tirabuzón infinito, donde el entrenamiento se realiza con datos ya creados de forma generativa.

“Si pudiera obtener todos los datos que necesita en la web, sería increíble”, dijo al Financial Times Aidan Gómez, director universal de Cohere, una empresa LLM de $2 mil millones. “En ingenuidad, la web es tan ruidosa y desordenada que no es verdaderamente representativa de los datos que desea. La web simplemente no hace todo lo que necesitamos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir