INTELIGENCIA ARTIFICIAL GENERAL: ES HORA DE VOLVER AL LABORATORIO
En la actualidad hay una carrera desenfrenada por el desarrollo de la llamada Inteligencia Artificial General (AGI) en la que un pequeño grupo de personas tienen recursos casi ilimitados de computación y dinero con el objetivo de ser uno de ellos el que pase a la libros de historio como el creador de la AGI. La IA Generativa, como ChatGPT, es lo que se conoce como Inteligencia Artificial Estrecha, esto significa que es muy buena en tareas específicas (generar texto, imágenes, código), pero no posee una comprensión o capacidad de razonamiento general como la de un ser humano, que el objetivo de la AGI.
Corrientes de pensamiento
En la actualidad, y como bien explica Aleix Valls en su conferencia “La última cena en Silicon Valley”, hay dos corrientes de pensamiento:
- La escalabilidad como solución. Esta corriente de pensamiento es casi un dogma para los programadores de EEUU, y establece como eje fundamental la necesidad única de crecer en capacidad de computo, datos y entrenamiento para lograr la AGI.
- Los modelos del mundo. Otra corriente de pensamiento dice que la escalabilidad no es la solución para lograr una IA con capacidad de comprensión del mundo que le permita generalizar, que el problema reside en que la tecnología actual de los Transformers sobre la que se basa la IA Generativa cuyo conocimiento se adquiere por fuerza bruta, pero no por comprensión, por lo que puede que ya haya tocado techo.
Definiendo el Razonamiento en IA
En la práctica, el razonamiento en la IA se manifiesta en tres formas interrelacionadas que le permiten trascender el modelado basado en correlaciones:
- Razonamiento estructurado (basado en reglas): Consiste en aplicar principios generales a situaciones específicas. Un ejemplo claro es un coche autónomo que, al reconocer una luz roja, se detiene en cumplimiento de las leyes de tráfico.
- Razonamiento inductivo: Implica identificar patrones en observaciones pasadas para inferir reglas más amplias. Un modelo meteorológico que asocia nubes oscuras con una lluvia inminente opera de esta manera.
- Razonamiento abductivo: Se utiliza para formular la explicación más plausible ante datos incompletos. Por ejemplo, un sistema médico que, a partir de síntomas como fiebre y fatiga, infiere que la gripe es la causa más probable.
Esta clasificación del razonamiento revela que, mientras la IA puede ejecutar estas funciones de forma aislada, los sistemas actuales carecen del marco cognitivo unificado que permite a los humanos integrarlas fluidamente.
El Modelo de Mundo como Solución Arquitectónica
La pieza crucial que falta en la arquitectura de la IA moderna es el Modelo de Mundo, un “mapa cognitivo interno” que permite a un sistema construir una comprensión estructurada y dinámica de su entorno. A diferencia de los LLM, que dependen únicamente de las asociaciones estadísticas de sus datos de entrenamiento, un Modelo de Mundo captura relaciones, reglas y vínculos causales.
Para habilitar un razonamiento genuino, un Modelo de Mundo debe poseer tres propiedades clave:
- Representaciones estructuradas y causales: Debe incluir un modelo del mundo físico que le permita ir más allá de los patrones y abordar la inferencia causal en la toma de decisiones.
- Soporte para la abstracción: Debe permitir la identificación y manipulación abstracta de conceptos, de forma similar a como los humanos construyen razonamientos lógicos.
- Capacidad interactiva y adaptable: Debe poder ser enseñado, refinando su comprensión a través de la retroalimentación humana, la experiencia en el mundo real y las demostraciones de expertos.
La teoría del desarrollo de Jean Piaget ofrece el plano arquitectónico perfecto para construir estos Modelos de Mundo, proporcionando los mecanismos de esquemas cognitivos, etapas de desarrollo y aprendizaje activo necesarios para materializar estas propiedades clave de representación estructurada, abstracción e interactividad. Te dejo a un paper de investigación titulado “World Models in Artificial Intelligence: Sensing, Learning, and Reasoning Like a Child” en el que se proponen marcos inspirados en Piaget para nuevos modelos del mundo de IA estructurados, destacando áreas como aprendizaje de la física, neurosimbolismo y deducción causal para lograr razonamiento genuino.
Es hora de volver al laboratorio
Tal y como os decía, hasta ahora, el desarrollo de la IA se ha guiado por la Ley de la Escalabilidad: la creencia de que más datos y más computación resultan automáticamente en más inteligencia. Valls argumenta que esto ha creado “estudiantes de 10.000 horas” que memorizan patrones y aprueban exámenes estadísticos (benchmarks), pero que no comprenden la lógica subyacente.
Las fuentes académicas, como el estudio anterior, coinciden plenamente: el razonamiento verdadero no depende de modelos más grandes, sino de enseñar a las máquinas a pensar. Volver al laboratorio significa aceptar que, aunque los LLMs son excelentes capturando correlaciones estadísticas, carecen de sentido común y de capacidades cognitivas esenciales como el razonamiento abstracto y que se debe investigar para lograr una tecnología distinta a los LLMs que aún no tenemos. Volver al laboratorio implica cambiar cómo aprende la IA. Siguiendo la teoría de Jean Piaget, las nuevas investigaciones proponen que el conocimiento no debe absorberse pasivamente de océanos de datos, sino construirse activamente a través de la interacción.
El laboratorio debe centrarse en áreas críticas que la escalabilidad no puede resolver por sí sola:
- IA Simbólica y Neurosimbólica: Para combinar el aprendizaje estadístico con reglas lógicas y conceptos abstractos.
- Inferencia Causal: Para que la máquina entienda el “porqué” de las cosas, permitiéndole navegar la realidad como un niño que experimenta con el mundo.
- Aprendizaje Informado por la Física: Para que el modelo comprenda las leyes naturales, reduciendo su dependencia de bases de datos masivas
El desarrollo de esta nueva tecnología no es un problema que se solucione en unos pocos años, sino que tardaremos entre 5-15 años en desarrollar una nueva tecnología sobre la que se pueda desplegar una AGI. Mientras tanto tenemos mucho que hacer, y es aprender a utilizar la IA como una herramienta capaz de aumentar nuestras capacidades cognitivas, que es justo lo que trato de hacer con ICAU, el Instituto de Cognición Aumentada. No detengas tu desarrollo jamás!!!!
Seguimos adelante!!
