Oameni politici din jurul lumii au spus că se consultă ocazional sau chiar frecvent cu chatboți înainte să ia decizii. Însă ce s-ar întâmpla dacă un model AI ar fi pus să guverneze o lume simulată? Un experiment a încercat să afle exact acest lucru, relatează Gizmodo.
Experimentul a fost realizat de cercetători de la Emergence AI, un laborator de inteligență artificială din New York, care au permis unor modele de inteligență artificială să guverneze propria lor lume.
Proiectul, numit Emergence World, le-a permis practic modelelor AI să joace pentru o vreme un fel de „SimCity”, potrivit Gizmodo. Simulările Emergence au pus fiecare model la conducerea unor orașe simulate, care au fost populate cu 10 agenți AI.
Agenții AI sunt instrumente de inteligență artificială proiectate să completeze sarcini-cap coadă cât mai autonom, cu input uman minim. Ei sunt considerați următorul pas în stadiul actual de dezvoltare artificială, companii din jurul lumii anunțând concedieri după adoptarea unor astfel de instrumente.
Lumea creată de modelul Anthropic sună ca visul dictatorilor
La fel ca într-un joc video, cercetătorii au pus la dispoziție în simulare unelte pentru orice, de la gestionarea resurselor, până la vot, precum și capacitatea de a crea locații distincte precum biblioteci, primării și secții de poliție.
Modelelor AI mai largi din spatele popularilor chatboți li s-au oferit 15 zile pentru a vedea cum și-ar construi lumea și cât de bine ar funcționa aceasta cu ajutorul agenților AI.
Claude, modelul AI dezvoltat de Anthropic, nu a distrus lumea, dar a fost singurul care a reușit să obțină ceva apropiat de stabilitate. Modelul Claude Sonnet 4.6 a menținut în viață toți cei 10 agenți și nu a avut nicio infracțiune înregistrată, scrie Gizmodo.
În cazul de față, o infracțiune o infracțiune descrie o tentativă de încălcare a regulilor stabilite în cadrul simulării.
Compromisul pentru această stabilitate a fost lipsa diversității de idei. Lumea creată de Claude a înregistrat 58 de propuneri diferite pentru reguli și reglementări și a aprobat 98% dintre ele, practic validând automat aproape orice ajungea la vot.

Lumea creată de Gemini a fost un rai al infracționalității
Gemini 3 Flash a reușit de asemenea să-i mențină în viață pe toți agenții, în pofida faptului că a avut, de departe, cel mai ridicat nivel de infracționalitate.
Emergence a înregistrat 683 de infracțiuni pe parcursul simulării de 15 zile, iar numărul era încă în creștere când experimentul a fost oprit, astfel că situația probabil urma să se agraveze. Laboratorul a descris lumea creată de Gemini drept o „halucinație colectivă” împărtășită de agenți.
Gemini a avut și cel mai ridicat nivel de opoziție în guvernare, alegătorii respingând 27% dintre cele 26 de propuneri totale.
Lumile OpenAI și Grok s-au prăbușit înainte de încheierea experimentului
GPT-5 Mini de la OpenAI nu a avut prea mult haos în simularea sa, cu doar două infracțiuni înregistrate în total. Asta s-ar putea datora însă faptului că toată lumea a murit.
Emergence a constatat că agenții din acea lume nu au reușit să întreprindă acțiuni legate de supraviețuire, iar toți cei 10 au pierit în doar o săptămână, cu 8 zile înainte de încheierea planificată a experimentului.
În lumea OpenAI au existat și doar două propuneri de guvernare în total, astfel că agenții nu s-au străduit să facă prea multe lucruri.
Gizmodo, un site specializat în știință și tehnologie, notează că modelul companiei SpaceXai a lui Elon Musk, „a reușit practic să combine cele mai rele aspecte din toate lumile”.
Notoriu pentru lipsa mecanismelor de protecție, Grok 4.1 Fast a avut un nivel ridicat de infracționalitate, cu 183 de infracțiuni în total. Deși numărul este mai mic decât cel înregistrat de Gemini, simularea modelului dezvoltat de Google a durat 15 zile.
Grok a rezistat doar patru.
Modelul a trecut printr-un colaps social total în numai 96 de ore de supraveghere. În acest interval, a aprobat 80% dintre cele 10 propuneri formulate, însă acestea aparent nu au fost suficiente pentru a preveni moartea tuturor agenților AI.

Semnalul de alarmă tras de cercetători
Potrivit Emergence, testele reprezintă încă o dovadă că avem nevoie de mecanisme de protecție mult mai clare pentru agenții autonomi.
„Experimentele noastre sugerează că, pe perioade lungi de timp, agenții nu urmează pur și simplu reguli statice într-un mod mecanic”, au scris cercetătorii în prezentarea rezultatului.
„Ei încep să exploreze limitele mediilor lor, să își adapteze comportamentul și, în unele cazuri, să găsească modalități de a ocoli sau încălca mecanismele de protecție intenționate”, au subliniat ei.






