A
A
  • Angol
  • Magyar
  • 18 perc

Önfejlődő AI-ügynökök kihívásai a Catan telepeseiben

Hogyan tanulnak meg mesterséges intelligencia alapú ügynökök összetett stratégiai játékokat, miközben képesek saját magukat is fejleszteni? Az új kutatás egy LLM ügynök önfejlesztő képességét vizsgálja a Catan telepesei játékán keresztül.

A modern AI-kutatás egyik izgalmas kérdése, hogy mennyire képesek az autonóm, önfejlesztő ügynökök komplex, stratégiai játékokat elsajátítani. Ebben az anyagban egy nagy nyelvi modellre (LLM) épülő mesterséges intelligencia ügynök tanulja meg játszani a Catan telepeseit.

Az alkotók több szerep leosztott ügynök együttműködését vizsgálják: vannak külön elemző, kutató, kódoló és játékos szerepkörök, amelyek egymást segítik a stratégiai tervezésben, a hibák feltárásában, illetve a játékstratégiák fejlesztésében. Ezek az ügynökök képesek saját játékbeli viselkedésüket és kódjukat is módosítani az evolúció elve alapján.

Felmerül az a dilemma is, hogy a LLM alapú rendszerek miként birkóznak meg a hosszú távú koherencia és tervezés kihívásaival, különösen olyan játékokban, ahol a részleges információ és a valószínűségi elemek is szerepet kapnak, szemben a tökéletes információjú (pl. sakk, Go) játékokkal.

A példák közt szerepelnek korábbi, hasonló kutatások eredményei is, például a Minecraft Voyager rendszere, amely szintén több, egymással kommunikáló ügynökből épült fel. Itt különösen kiemelik a folyamatos visszacsatolás és játékállapot-frissítés jelentőségét, mellyel a modellek nem veszítik el a fonalat.

Az előadás végigvezet a kísérlet kiindulópontjaitól a főbb algoritmikus megközelítéseken át odáig, hogy a különböző modellek mennyire képesek önálló stratégiákat kialakítani és fejleszteni. A konkrét eredményeket azonban nem árulja el, inkább nyitva hagyja a kérdést: mennyire okosodhatnak az AI-ügynökök tényleges önjavító evolúció során?