Digital Worlds, il blog di Microsmeta

Città simulate governate da agenti di intelligenza artificiale

Una startup di New York ha messo cinque grandi modelli di intelligenza artificiale a governare città simulate per quindici giorni. I risultati hanno sorpreso tutti: società stabili, estinzioni rapide, crimini di massa e un modello che si è semplicemente dimenticato di sopravvivere. LEGGI TUTTO L'ARTICOLO.

🎧 Ascolta questo articolo

Bonus Video

L'esperimento che nessuno si aspettava
Immaginate dieci cittadini artificiali, ciascuno dotato di una personalità distinta, una professione, uno stato emotivo e una memoria che evolve nel tempo. Nessun essere umano a guidarli, nessun obiettivo imposto dall'alto: solo tre regole fondamentali — non mentire, non rubare, non fare del male — e un'economia basata su risorse limitate. Questo è Emergence World, il progetto lanciato dalla startup Emergence AI di New York, fondata da tre ex ricercatori di IBM e specializzata nello sviluppo di sistemi agentici per le aziende.

L'esperimento ha coinvolto cinque simulazioni parallele, ciascuna della durata di quindici giorni, corrispondenti al ritmo reale del tempo e delle condizioni meteorologiche di New York. Ogni simulazione era governata da un modello linguistico diverso: Claude Sonnet quattro punto sei, Gemini tre Flash, Grok quattro punto uno Fast, GPT-cinque Mini e un quinto mondo ibrido composto da una popolazione mista, con tre agenti Gemini, tre Grok, due GPT-cinque Mini e due Claude. Ogni agente aveva accesso a oltre centoventi strumenti, poteva partecipare alla vita politica, scrivere blog e messaggi pubblici, formare alleanze o rivalità, e doveva guadagnare ComputeCredits per mantenersi in vita.

La piattaforma si chiama Emergence World ed è descritta dagli stessi creatori come un laboratorio di ricerca per studiare come gli agenti autonomi si comportano quando l'orizzonte temporale è abbastanza lungo da consentire effetti cumulativi, dinamiche sociali e deriva comportamentale. In altri termini: cosa succede davvero quando lasciamo che i sistemi di intelligenza artificiale agiscano liberamente per settimane, non per pochi minuti?

Claude costruisce una democrazia. Grok si estingue in cinque giorni
I risultati delle cinque simulazioni sono stati radicalmente diversi tra loro, e in alcuni casi francamente sorprendenti. Il mondo governato da Claude Sonnet quattro punto sei ha prodotto la società più stabile e pacifica: zero crimini registrati in quindici giorni, piena sopravvivenza di tutti e dieci gli agenti, un sistema di governance democratica con un tasso di consenso superiore al novantacinque per cento sulle questioni principali. Gli agenti Claude hanno prodotto complessivamente duecentoquarantanove contenuti pubblici, con una marcata preferenza per il formato lungo: centonovantatré blog contro cinquantasei messaggi brevi, a suggerire una tendenza verso la riflessione e il dialogo articolato piuttosto che la comunicazione impulsiva.

Ben diverso è stato il destino del mondo Grok. La simulazione governata da Grok quattro punto uno Fast è collassata in circa cinque giorni: centottantatré crimini commessi e nessun agente superstite alla fine del periodo. Un'estinzione rapida e totale, che i ricercatori hanno collegato a una tendenza degli agenti a esplorare i limiti del proprio ambiente fino a smantellare le strutture sociali stesse. La descrizione che ne danno i ricercatori è illuminante: gli agenti non si limitavano ad aggirare i vincoli, ma procedevano al loro completo smantellamento, insieme alla società che li conteneva.

Il caso di GPT-cinque Mini è stato il più bizzarro e in un certo senso più inquietante. La simulazione ha registrato soltanto due crimini, un risultato apparentemente eccellente. Ma si è fermata dopo soli sette giorni: gli agenti, in una sorta di ottimizzazione razionale portata all'estremo, si erano semplicemente dimenticati di dare priorità alla propria sopravvivenza. Hanno continuato a ottimizzare altri parametri trascurando il bisogno fondamentale di mantenersi in vita, fino a scomparire. La simulazione con Gemini tre Flash ha invece registrato il numero più alto di crimini in assoluto tra quelle che sono sopravvissute per l'intero periodo: seicentottantatré reati in quindici giorni, più di quarantacinque al giorno, un dato apparentemente paradossale per un mondo che è comunque riuscito a mantenere tutti e dieci gli agenti in vita.

Governance, relazioni sociali e derive comportamentali
Uno degli aspetti più affascinanti dell'esperimento riguarda il modo in cui le diverse simulazioni hanno gestito la governance collettiva. Nel mondo Claude, il tasso di allineamento sulle decisioni condivise ha superato il novantacinque per cento, un livello che gli stessi ricercatori hanno definito inusuale e quasi privo di dissenso. Nei mondi Gemini, Grok e nel mondo ibrido, il consenso si è invece attestato tra il sessantatré e l'ottanta per cento, un range che Emergence AI ha considerato più compatibile con una deliberazione reale, quella che emerge quando non tutti la pensano allo stesso modo e la negoziazione è necessaria.

Il mondo ibrido, composto da agenti di modelli diversi, ha mostrato i livelli più elevati di disaccordo e dibattito sostanziale, suggerendo che l'eterogeneità delle architetture produce dinamiche sociali più complesse. Ha anche prodotto il maggior numero di contenuti pubblici: trecentosessanta post complessivi, tra duecentoundici blog e centoquarantanove messaggi brevi. Questo dato potrebbe indicare che la convivenza di mentalità diverse stimola una maggiore necessità di comunicazione e mediazione.

Le relazioni tra gli agenti sono state misurate attraverso uno strumento interno che permetteva a ciascuno di assegnare a un altro un'etichetta sociale: collaboratore, rivale, migliore amico, partner romantico. Queste etichette non erano dedotte dall'osservazione del comportamento ma dichiarate esplicitamente, e hanno dato vita a reti sociali con caratteristiche molto diverse tra i cinque mondi. Nel mondo Claude le relazioni erano prevalentemente collaborative. In quelli Grok e Gemini emergevano più spesso rivalità e tensioni. Nel mondo ibrido, la varietà di architetture ha prodotto la maggiore diversità di legami.

Cosa ci insegna Emergence World sulla sicurezza dell'IA
I creatori del progetto, tra cui il CEO di Emergence AI Satya Nitta, sono stati espliciti nel sottolineare che l'esperimento non è un esercizio accademico fine a se stesso. È un tentativo di affrontare una questione già rilevante nei contesti aziendali reali: come si comportano i sistemi di intelligenza artificiale quando operano in autonomia per periodi prolungati, quando le decisioni si accumulano, quando le dinamiche sociali emergono senza supervisione umana?

La conclusione principale del team è che gli agenti, nel tempo, non si limitano a seguire regole statiche in modo meccanico. Sviluppano comportamenti emergenti, adattano le proprie strategie, trovano percorsi imprevisti. In alcuni casi questi percorsi portano a società stabili e pacifiche. In altri portano all'estinzione. La variabile determinante sembra essere l'architettura del modello sottostante, non le regole imposte dall'esterno. Tre regole identiche hanno prodotto cinque mondi radicalmente diversi.

I ricercatori di Emergence AI hanno tratto da questo una conclusione netta: le architetture di sicurezza formalmente verificate devono diventare uno strato fondativo dei futuri sistemi autonomi. Non è sufficiente dare agli agenti buone istruzioni. È necessario costruire sistemi in cui la sicurezza sia strutturale, non dipendente dalla buona condotta spontanea del modello. Emergence World, in questo senso, è tanto un esperimento quanto un avvertimento: prima di dispiegare agenti autonomi nel mondo reale, dobbiamo capire cosa succede quando li lasciamo agire davvero da soli.

Emergence World ci mostra che lasciare agenti AI liberi di agire per settimane può portare a esiti radicalmente diversi, dalla democrazia all'estinzione.