La Inteligencia Artificial General no es posible con la tecnología actual
El año 2023 ha sido el de la explosión de la Inteligencia Artificial Generativa, de hecho, ha sido tal la fuerza evolutiva de la IA con las redes neuronales (#DeepLearning) y los modelos largos del lenguaje (#LLM), que ha surgido un viejo debate: ¿Es posible una Inteligencia Artificial General?
¿Qué es la Inteligencia?
Lo único que hoy día conocemos y clasificamos como inteligente son las personas, y lo son gracias a su cerebro. La Inteligencia es la capacidad que tiene nuestro cerebro de aprender con un propósito general. Somos inteligentes no por el hecho de hacer muy bien una cosa en particular, sino por ser capaces de aprender cualquier cosa por la que tengamos curiosidad y/o motivación.
El neocórtex es el órgano de la inteligencia. Casi todas las capacidades que consideramos inteligentes como la visión, el lenguaje, la música o las matemáticas, son creaciones del neocórtex. El neocórtex es la parte “nueva” de nuestro cerebro, ocupa aproximadamente el 70% del total del cerebro, y es particularmente grande si lo comparemos con el resto de mamíferos. Por cierto, la primera persona que observó el interior del neocórtex fue Santiago Ramón y Cajal, médico español cuya contribución a la ciencia mereció un Premio Nobel.
Según Jeff Hawkins, la explicación de la inteligencia es que el neocórtex esta preparado desde nuestro nacimiento para sentir (ver, oír…) y construir un modelo increíblemente complejo del mundo. Todo lo que conocemos del mundo como un bolígrafo, un edificio o un concepto son elementos que forman parte de ese complejo modelo del mundo. Además, dicho modelo es predictivo, es decir, que el cerebro predice sin cesar cuáles serán las próximas entradas de información al modelo, predicciones que no advertimos hasta que no se cumplen. Por ejemplo, si una noche entras a casa y un objeto de tu salón no está donde los esperabas (predicción) enseguida recibirás una alerta. Nuestro cerebro aprende a través de los cambios, si algo no ocurre como se esperaba, el modelo se actualiza. Por último, para ayudar en la construcción del modelo complejo del mundo, nuestro cerebro construye objetos/conceptos individuales y los relaciona a través de posiciones relativas entre ellos, y para hacer esto utiliza marcos de referencia.
Por tanto, podemos concluir que somos inteligentes por nuestra capacidad de aprender constantemente un modelo complejo y predictivo del mundo ayudado por miles de marcos de referencia.
¿Qué tendría que tener un sistema inteligente general?
Con todo lo anterior, podríamos decir que un sistema inteligente general debería tener los siguientes elementos:
- Aprendizaje continuo y flexible. Un sistema inteligente general debería se capaz de aprender de forma continua un modelo del mundo cambiante. La flexibilidad requiere adaptarse a las condiciones cambiantes del mundo y al nuevo conocimiento, que debe sumar al anterior sin borrarse.
- Movimiento. No se puede percibir el mundo de una sólo vez, por tanto, el sistema inteligente debería ser capaz de moverse para aprender. No hablo solo de movimiento físico, sino que podría ser navegar por la red.
- Diversidad de modelos. La construcción de un modelo complejo del mundo por parte de un sistema inteligente tendría que ser capaz construir muchos modelos para adquirir el conocimiento de una cosa en particular.
- Almacenamiento del conocimiento. Un sistema inteligente general debería ser capaz de almacenar su conocimiento a través de diversos marcos de referencia que lo explicasen. No basta con etiquetar una imagen como gato si el sistema no sabe lo que es un gato.
“Nada de lo que hoy llamamos Inteligencia Artificial es inteligente”
Jeff Hawkins
¿Por qué la tecnología actual que tenemos no es válida para construir una Inteligencia Artificial General?
La tecnología actual que ha desarrollado gran parte del salto evolutivo de la Inteligencia Artificial son las redes neuronales profundas o Deep Learning. Se trata de algoritmos que diseñan una estructura de cientos de capas y que trabajan con gran cantidad de datos no estructurados para extraer sus características. Durante el entrenamiento del algoritmo, éste se ajusta a través de las funciones de Gradiente y Backpropagation que le permiten al algoritmo ir afinando en sus respuestas.
Detrás del famoso Chat GPT, la tecnología que hay detrás son los modelos LLM (Large Language Models) y se trata de un tipo de red neuronal como la anterior, como una estructura determinada, y entrenada con millones de parámetros para reconocer e interpretar el lenguaje humano. De forma simplificada podríamos decir que Chat GPT es un modelo que ha aprendido muy bien estadística y que sabe muy bien que palabra tiene que insertar en cada momento para generar la respuesta a una pregunta.
Ahora bien, con lo que ya sabemos de la tecnología actual y con lo indicado en el punto anterior sobre qué debe tener un sistema inteligente, podemos concluir que con la tecnología actual no podemos llegar a una Inteligencia Artificial General por las siguientes razones:
- La redes neuronales actuales pueden aprender a realizar una tarea en concreto muy bien, pero si queremos enseñarla otra tarea distinta, ese algoritmo ha de borrar lo que sabe para aprender algo nuevo. Si no queremos borrar nada para incorporar aprendizajes nuevos, con la tecnología actual, debemos incorporar cientos, miles y millones de algoritmos donde cada uno sepa hacer una cosa, pero no es así como funciona nuestro cerebro. Nuestro cerebro tiene un funcionamiento básico universal que le permite aprender cualquier cosa sin perder lo anterior.
- Las redes neuronales no son capaces de construir un modelo del mundo tal y como necesitaría una Inteligencia Artificial General porque no son capaces de asumir un aprendizaje continuo general a través de múltiples modelos.
- La inteligencia de propósito general requiere de marcos de referencia de propósito general que puedan aplicarse a muchos tipos de problemas, y las redes neuronales hoy no trabajan sobre marcos de referencia.
- Aprendemos a través del movimiento, y la tecnología de hoy no dispone de movimiento que permita a sus sensores construir un modelo del mundo. La tecnología de hoy es entrenado con datos, con millones de datos, de la red, pero no dispone de formas de ver y oír el mundo desde varias perspectivas.
Por tanto, vivimos actualmente un salto evolutivo de la Inteligencia Artificial que nos va a permitir desarrollar aplicaciones de gran valor, pero esta tecnología parece no ser suficiente para desarrollar una Inteligencia Artificial General, sin embargo, todo parece indicar que no hay una limitación tecnológica, sino que no hemos descubierto el lenguaje universal que la tecnología ha de utilizar para aprender cualquier cosa.
Por cierto, la inteligencia de nuestro cerebro reside en el neocórtex tal y como hemos avanzado, la otra parte de nuestro cerebro, la que desarrolla funciones como las emocionas, la necesidad de reproducción, el dolor y otros temas es una parte más compleja, pero que no tendríamos la necesidad de replicar para construir un sistema inteligente, por tanto, es aún más evidente de que parece que no tenemos dicha limitación tecnológica.
Fuentes:
- Jeff Hawkins. Mil cerebros.
- Geoffrey Hinton. Fundamentos de las redes neuronales.
- Héctor Ruiz Martín. ¿Como aprendemos?.