EL FRACASO DE LA TECNOLOGÍA ESTÁ SERVIDO CUANDO SE DESCONOCEN SUS FUNDAMENTOS MÁS ELEMENTALES
Esta mañana un amigo pasa un Whatsapp diciendo que ha leído como una consola de 1977 ha ganado al ajedrez a ChatGPT y Gemini. Además, me daba a entender que tanto ruido con la IA y luego no es capaz de ganar a una Atari.
He indagado en la noticia y encontrado una publicación en Linkedin por un ingeniero de Citrix llamado Robert Caruso que lo explica, y cuyo enlace dejo más abajo. El experimento consistió iniciar una partida de ajedrez de Atari a través de un emulador e irle pidiendo a los modelos de lenguaje como ChatGPT y Gemini que movimiento debería ser el siguiente.
Según el propio Caruso cuenta, los dos modelos de lenguaje se mostraron muy confiados al inicio, pero ya desde los primeros movimientos se pudo ver como la destreza de la Atari superaba los movimientos de los LLMs provocando finalmente la derrota de éstos.
¿Qué ha pasado?
¿La IA no es tan buena como nos dicen? No, lo que ocurre lo tenemos que entender desde los fundamentos principales de cada tecnología. La Atari, aunque obsoleto, tiene una programación sencilla pero específica para jugar al ajedrez a través de árboles de decisión, y los modelos de lenguaje son modelos estadísticos del lenguaje entrenadas con información masiva pero general. Así, un LLM no está optimizado de ninguna forma para entender el tablero del ajedrez, no sabe calcular variantes de jugadas, no es capaz de recordar todas las partidas del juego pasadas y le resulta muy complicado predecir con anticipación unos pocos movimientos futuros, además, tal y como el propio Caruso decía no siempre juega legalmente cometiendo errores en las reglas.
Moraleja: Cada tecnología tiene sus fortalezas y hay que conocerlas para sacar el máximo valor de ella. Cuando una tecnología no funciona en un caso de uso de aplicación en una empresa, el problema no es de la tecnología, el problema es de las personas que decidieron utilizar la tecnología en ese contexto. Hace unos días escribía un artículo titulado “EL 40% DE LOS PROYECTOS DE AGENTES IA SE CANCELARÁN A FINALES DE 2027” y ejemplos como el del Ajedrez le dan la razón. El problema no es la tecnología per sé, sino el uso que hacemos de ella.