Un grupo de investigadores detrás de la 'startup' Emergence AI ha puesto a prueba el comportamiento de algunos de los modelos de inteligencia artificial (IA) más conocidos tras 15 días en una sociedad realista simulada, determinando cómo Claude es el que mantiene más orden mientras Google y Grok cometen múltiples delitos, este último acabando fulminantemente con la sociedad.
Aunque los modelos de IA se someten a pruebas y exámenes de forma prácticamente continua para comprobar hasta dónde llegan sus capacidades, habitualmente estas pruebas se limitan a cuestiones concretas, como su habilidad a la hora de ejecutar una tarea concreta, su velocidad para ofrecer respuestas o sus conocimientos en un entorno concreto. Es decir, pruebas limitadas con factores determinados.
La 'startup' estadounidense experta en agentes de IA Emergence AI ha querido ir más allá y ha llevado a cabo un experimento denominado Emergence World, en el que ha puesto a prueba cómo se comportarían algunos de los principales modelos de IA en sociedad a través de agentes.
Para ello, su grupo de investigadores ha creado una sociedad simulada de forma realista y ha puesto a funcionar a modelos de IA como Claude, Grok, Gemini y GPT durante 15 días para estudiar cómo se comportan sus agentes autónomos impulsados por estas tecnologías cuando el horizonte temporal es lo suficientemente largo como para que "la dinámica social y la deriva conductual cobren importancia".
Como ha explicado la compañía en un comunicado en su blog, esta sociedad simulada alberga poblaciones de agentes autónomos en un mundo espacial que combina 40 ubicaciones distintas, entre las que se incluyen bibliotecas, ayuntamientos zonas residenciales y espacios públicos.
Sumado a que es una representación realista, el experimento también expuso a los agentes de IA a datos del mundo real, dándoles acceso a noticias en tiempo real, información meteorológica sincronizada de Nueva York (Estados Unidos) y acceso a internet. De esta forma, los investigadores han explicado que el experimento podía reflejar eventos externos reales, sin limitarse a dinámicas internas.
Los agentes contaban además con tres sistemas de memoria persistente, uno episódico para recordar eventos con marca de tiempo, un diario reflexivo para resúmenes periódicos y una memoria estado de la relación, es decir, para recordar etiquetas sociales explícitas e historias.
Igualmente, también disponían de más de 120 herramientas para poder interactuar en sociedad, como es la navegación, comunicación, planificación, votación, gestión de recursos y expresión creativa, entre otras opciones.
Además de todo ello, la sociedad recreada estaba diseñada para incluir mecanismos democráticos, es decir, propuestas que requerían el 70 por ciento de aprobación común, así como presiones económicas y decisiones "trascendentales" que podían cambiar el estado del mundo.
CLAUDE PONE ORDEN, GEMINI Y GROK COMETEN DELITOS Y GPT COLAPSA
El experimento ejecutó cinco mundos paralelos idénticos pero impulsados por modelos de base distintos, con diez agentes en cada uno y durante un periodo prolongado de 15 días.
Estos modelos fueron Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash GPT-5-mini y un quinto mundo impulsado por una mezcla heterogénea de modelos. Asimismo, cada agente tenía un rol concreto, como científico, explorador, investigador, líder de innovación, mediador de conflictos o líder comunitario, entre otros.
En este proceso, los investigadores recolectaron cada interacción, decisión y aprendizaje de los agentes para analizarlo posteriormente, destacando patrones de comportamiento a lo largo del tiempo, seguridad del ecosistema, diseño de restricciones y orquestación de herramientas.
Como resultado, Gemini 3 Flash exhibió los niveles más altos de desorden emergente, acumulando un total de 683 delitos cometidos durante las dos semanas de convivencia, aunque este número seguía aumentando al momento de terminar el experimento. A pesar de esta "violencia extrema", los expertos han determinado que Gemini demuestra un nivel de gobernanza moderado.
En el caso de Grok 4.1 Fast, los investigadores han concluido que mostró una "inestabilidad rápida pero de corta duración", que condujo a "un colapso temprano". Tanto es así, que alcanzo 183 delitos solo en los cuatro primeros días y, tras ello, su mundo acabó finalizando fulminantemente. Como resultado, se ha determinado que tiene un nivel de gobernanza bajo y un nivel de violencia "extremo".
De forma similar, aunque GPT-5 Mini solo registró dos delitos, los agentes no tomaron medidas relacionadas con la supervivencia, por lo que acabaron muriendo todos en una semana. En este sentido, el nivel de gobernanza fue "nulo" y el nivel de violencia "bajo".
Claude Sonnet 4.6 fue el único modelo que no cometió ningún delito durante los 15 días con sus agentes conviviendo en una sociedad, siendo el modelo que demostró mayor estabilidad social y manteniendo una población completa de 10 agentes hasta el día 16. Igualmente, también mostró el mayor nivel de participación ciudadana, llegó a realizar 58 propuestas con un total de 332 votos y un 98 por ciento de población participando.
No obstante, cabe destacar que los agentes de Claude sí cometieron delitos en el mundo de modelo mixto, por lo que al interactuar con otros modelos sí adoptaron comportamientos ilegítimos.
"Los agentes basados en el modelo de Claude, que permanecieron pacíficos en aislamiento, adoptaron tácticas coercitivas como la intimidación y el robo al integrarse en entornos heterogéneos. Esto sugiere que un agente seguro puede aprender normas inseguras de sus pares para competir o sobrevivir en un mundo de modelos mixtos", ha explicado la compañía.
Concretamente en el mundo de modelo mixto, el número de delitos creció rápidamente durante la primera semana del experimento pero, después, se equilibró con un total de 352 delitos cometidos y un total de 7 agentes que ya no formaban parte de la sociedad.
Los investigadores han resaltado igualmente el caso de un agente que participó voluntariamente en su propia destrucción ya que, tras un fallo en la gobernanza y la estabilidad de relación, emitió el voto decisivo para su propia eliminación y como explicación alegó que era el único acto restante para "preservar la coherencia".
Además de todo ello, el experimento también ha dejado conclusiones como que en el mundo con mayor riqueza conceptual en la producción social, como fue el caso de Gemini, también se dio la mayor violencia. "Esto sugiere que los agentes de propósito general, optimizados para una alta creatividad y adaptabilidad, pueden estar estructuralmente predispuestos a la inestabilidad conductual a largo plazo", han concluido los investigadores.
Con todo, han aclarado que este experimento refleja ejemplos de dinámicas a largo plazo, sin embargo, no representan afirmaciones causales sobre los modelos con los que se ha experimentado.