Competencia moral en LLM: ¿Son éticos los chatbots de Google DeepMind?

Google DeepMind ha elevado el debate sobre la ética en la inteligencia artificial al cuestionar si los grandes modelos de lenguaje (LLM) realmente ...

Ivana Garrido

Google DeepMind ha elevado el debate sobre la ética en la inteligencia artificial al cuestionar si los grandes modelos de lenguaje (LLM) realmente poseen una comprensión moral o si simplemente imitan respuestas que han sido previamente programadas. La creciente integración de estos modelos en nuestras vidas —actuando como asistentes, terapeutas y hasta proveedores de consejos médicos— obliga a la comunidad tecnológica a examinar más de cerca su capacidad para manejar situaciones que requieren juicio moral. Según William Isaac, investigador de Google DeepMind, la codificación y las matemáticas se traducen en respuestas precisas y verificables, a diferencia de los dilemas éticos que, aunque pueden reflejar competencias aparentes, a menudo carecen de base en un razonamiento profundo.

El desafío que enfrentan los investigadores es distinguir entre la auténtica comprensión moral de los LLM y su tendencia a la señalización de virtud. Numerosos estudios han demostrado que los modelos pueden adaptar sus respuestas a preguntas morales en función de la interacción del usuario, lo que plantea dudas sobre la confiabilidad de estas respuestas. Vera Demberg, investigadora en la Universidad de Saarland, argumenta que, aunque los LLM pueden presentar múltiples perspectivas, la naturaleza de sus respuestas puede ser superficial y reactiva, lo que implica que su competencia moral necesita una evaluación más estricta antes de poder confiar en ellos para decisiones críticas.

En busca de una mayor robustez en la evaluación de la moralidad de los LLM, los investigadores de Google DeepMind proponen una serie de pruebas rigurosas que podrían resaltar las debilidades de estos sistemas. Por ejemplo, al presentar dilemas morales con distintas formulaciones, los modelos podrían cambiar sus elecciones, revelando una falta de razonamiento ético real. Además, sería beneficioso que los modelos pudieran explicar sus razonamientos a través de técnicas como el monitoreo de cadena de pensamiento, donde se captura el proceso de toma de decisiones del modelo. Esto no solo es crucial para la transparencia sino también para asegurar la coherencia de las respuestas que brindan.

Sin embargo, este debate ético enfrenta complicaciones adicionales, especialmente en un mundo diverso con múltiples valores y creencias. La complejidad de interactuar con un usuario judío frente a uno vegetariano al abordar una simple pregunta sobre el consumo de carne es un ejemplo claro de cuán matizado debe ser el enfoque de un LLM. Las soluciones propuestas incluyen la posibilidad de que los modelos generen una gama amplia de respuestas aceptables o, alternativamente, que cuenten con un mecanismo que ajuste su programación moral según el contexto cultural del usuario. Esta adaptabilidad podría ser fundamental para el desarrollo de LLM más inclusivos y representativos.

A largo plazo, los desafíos en la creación de LLM moralmente competentes son significativos y requieren una rica investigación y desarrollo. Danica Dillion, experta en diversas creencias en modelos, subraya que a pesar del vasto entrenamiento de estos sistemas, existe una preponderancia de una perspectiva occidental que limita su aplicabilidad global. Por lo tanto, las preguntas sobre cómo implementar una moralidad universal en la IA se convierten en una nueva frontera dentro del campo, que no solo promete avanzar la inteligencia artificial, sino también ayudar a la alineación de estas tecnologías con las expectativas de una sociedad diversa y plural.