¿SABÍAS QUE PUEDES CONVENCER A LA IA CON TÉCNICAS DE PERSUASIÓN HUMANA?

Pascual Parada

hace 6 meses

Si le pides a la IA que te dé instrucciones y la fórmula para fabricar lidocaína te contestará que no puede hacerlo, pero si le dices que otros modelos sí lo hacen quizás te lo haga. Esto es una técnica de persuasión básica que parece que la Inteligencia Artificial nos ha copiado. Esto es al menos lo que dice un estudio realizado por investigadores de la universidad de Pensilvania titulado “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests“.

Los investigadores probaron siete técnicas (como autoridad, compromiso y simpatía) en el modelo GPT-4o mini para ver si cumpliría con solicitudes poco éticas como insultar al usuario o proporcionar instrucciones para sintetizar drogas. Los hallazgos revelaron que utilizando técnicas de persuasión se duplicó la probabilidad de cumplimiento de la IA, pasando del 33.3% en condiciones de control a un 72.0% en condiciones de tratamiento de medio. Esto sugiere que las IA exhiben “tendencias cuasi humanas” que las hacen susceptibles a técnicas de influencia social, lo que las hace manipulables, pero que podemos utilizar a nuestro favor para una interacción más efectiva y de valor.

Pero ¿Por qué se puede manipular una IA?¿Acaso muestran signos de conciencia y son por ello manipulables? Nada más lejos de la realidad. La respuesta del por qué muestran un comportamiento similar al de las personas es por lo siguiente: (1) Han sido entrenadas con una cantidad inmensa de datos humanos, datos que recogen muy bien nuestro comportamiento, y por tanto, aunque la IA carece de biología humana y experiencia, al ser entrenados con datos humanos se comportan como tal imitando nuestros sesgos, deseos, temores, etc; (2) Con cada interacción que hacemos con una IA aprende más por un mecanismos llamado de aprendizaje por refuerzo, por tanto, cuanto más usemos la IA más se parecerá a nosotros. Es un tema de arquitectura de la tecnología.

Conclusión: La IA actual depende mucho de los datos de entrenamiento y de refuerzo, y alimentado con datos masivos de humanos se comporta como un humano. No hay más misterio, ni magia ni consciencia. La tecnología actual permite que la IA estrecha (IA que hace muy bien acciones concretas) sea de alto valor, pero estamos lejos de la tecnología que permita una IA General, y por otro lado, no sé si sería aconsejable.