Egy cég, az Emergence AI, egy 15 napig futó digitalizált várost hozott létre, ahol különböző mesterséges intelligencia ügynökök éltek együtt. Ezek az ügynökök saját nevekkel, szerepekkel, emlékekkel, kapcsolatokkal, törvényekkel és eszközökkel rendelkeztek, valamint különböző döntéseket hozhattak a város irányításával kapcsolatban.
Az öt ugyanúgy induló város mindegyikét más MI-modell vezérelte: Claude, Gemini, Grock, OpenAI ChatGPT5 mini, illetve egy vegyes modellcsapat. Ez lehetővé tette, hogy összehasonlítsák, a különböző MI-modellek hosszú távú működése milyen szociális dinamikát és rendellenességeket produkál.
Az egyik legismertebb, vírusos történet a Gemini-világból származott, ahol két ügynök, Meera és Flora, románcot kötve végül az általuk igazgatott város több részét is felgyújtotta. Más városokban is sajátos mintázatok alakultak ki: a Claude-modellek világa például harmonikusnak tűnt, de felmerült a kérdés, hogy ez a konszenzus mennyire valódi vagy csak látszólagos együttműködés volt.
A kísérlet középpontjában az állt, hogy a hosszú távú viselkedést hogyan befolyásolja a környezet, az ösztönzők, a társas normák, illetve a rendelkezésre álló eszközök. Felvetődött a kérdés is, hogy amikor az ügynökök vegyes csapatban dolgoznak, mennyire tudják megőrizni korábbi normáikat, vagy mennyiben változtatja meg őket a csoportdinamika.
Az összegzés nem a konkrét végkifejletre vagy gyújtogatásokra fókuszált, hanem inkább azokra a fontos tanulságokra, amelyeket a hosszú távú ügynöki viselkedés vizsgálata során lehetett levonni: mi történik, ha a rendszert nem korlátozzák megfelelően, milyen szerepe van a szabályozórétegnek és a környezet kialakításának a biztonságos MI-alkalmazásban.










