El giro de guion de la ronda semilla récord
El 9 de marzo de 2026, Yann LeCun completó una ronda semilla de 1.03 mil millones de dólares para su startup AMI, un récord para una empresa europea. Esta financiación no es solo un evento financiero, sino una señal de quiebre: el modelo de inteligencia artificial de world models propuesto por LeCun se opone directamente al enfoque dominante de los grandes modelos de lenguaje (LLM). El enfoque en las predicciones físicas del comportamiento, en lugar del procesamiento del lenguaje, revela una estrategia técnica diferente, con implicaciones para la arquitectura cognitiva y la eficiencia computacional.
La declaración de LeCun, “We just completed our seed round, one of the largest seeds ever, probably the largest for a European company”, no es solo un anuncio financiero. Indica una voluntad de redefinir los parámetros técnicos de la IA, desafiando la hegemonía de los LLM. Este enfoque, que privilegia la comprensión del mundo físico, requiere un replanteamiento de los paradigmas de entrenamiento y de implementación, con consecuencias para la escalabilidad y la seguridad de los sistemas.
La fisiología de los modelos alternativos
Los world models de LeCun se basan en una arquitectura cognitiva que integra predicciones físicas e interacciones ambientales. A diferencia de los LLM, que procesan textos basándose en patrones estadísticos, estos modelos buscan simular el comportamiento de los objetos y de los agentes en un entorno concreto. Esto requiere un procesamiento computacional diferente, con un enfoque en datos sensoriales y simulaciones físicas, en lugar de tokenización lingüística.
La crítica de LeCun a los LLM no es solo teórica. Los grandes modelos de lenguaje, aunque potentes, presentan límites en términos de eficiencia energética y capacidad de interacción con el mundo físico. Los world models buscan superar estos límites, ofreciendo una solución más adecuada para tareas que requieren una comprensión contextual y una interacción directa con el entorno. Este enfoque, sin embargo, requiere una infraestructura de cálculo diferente, con implicaciones para la distribución y la gestión de los datos.
La simbiosis entre investigación y mercado
La visión de LeCun no está aislada. Andrej Karpathy, investigador de OpenAI, ha demostrado que un agente de IA autónomo puede mejorar la eficiencia del entrenamiento de un modelo de lenguaje en un 11%, probando 700 experimentos. Esto sugiere que los agentes de IA no solo ejecuten tareas, sino que también puedan optimizar de forma autónoma los procesos de aprendizaje. La frase clave de Karpathy, “AI agents can now do research on their own”, indica un punto de inflexión en la capacidad de auto-optimización, que podría reducir la dependencia de la intervención humana.
“AI agents can now do research on their own.”
Andrej Karpathy, OpenAI
Este desarrollo tiene implicaciones para el mercado y la investigación. Si los agentes de IA pueden optimizar de forma autónoma los procesos de aprendizaje, podría surgir una nueva clase de sistemas inteligentes que no solo ejecuten tareas, sino también se mejoren a sí mismos. Sin embargo, esta autonomía requiere una infraestructura de soporte robusta, con implicaciones para la seguridad y la ética de la IA.
Escenario en 3-5 años: la sedimentación de las tensiones
En mi opinión, la próxima década verá una sedimentación gradual de las tensiones entre modelos LLM y modelos alternativos. Los world models de LeCun podrían encontrar aplicaciones en sectores donde la comprensión contextual es crucial, como la robótica y la automatización industrial. Sin embargo, la hegemonía de los LLM no será reemplazada inmediatamente, ya que estos modelos tienen una infraestructura de soporte consolidada y una amplia base de usuarios.
El principal desafío será la adaptación de la infraestructura de cálculo y la gestión de los datos. Los world models requieren un procesamiento diferente, con un enfoque en datos sensoriales y simulaciones físicas. Esto podría llevar a una diversificación del ecosistema de la IA, con modelos diferentes que se adaptan a contextos específicos. La escalabilidad y la eficiencia energética serán los criterios clave para evaluar el éxito de estos modelos.
Foto de Andrey Matveev en Unsplash
Los textos son elaborados de forma autónoma por modelos de Inteligencia Artificial