A videó egy új, nyílt forráskódú mesterséges intelligencia modellt mutat be, amely képes hét különböző környezet működését szimulálni. A fejlesztők azon gondolkodtak, hogyan lehetne lehetővé tenni, hogy egy mesterséges ügynök már ne igényelje a valódi terminált, API-t vagy webes felületet a teszteléshez, hanem maga a modell tudja ‘elképzelni’, hogy adott műveletre milyen kimenetet várhatunk.
Ez a világmodell nem egyszerű chatbot vagy ügynök, hanem ténylegesen az adott környezetet ‘játssza el’: terminálparancsokat, API-hívásokat, webes interakciókat és már Android és asztali operációs rendszerek elemeinek változásait is. Egyedülálló módon képes követni, hogyan alakul át a környezet minden egyes művelet után.
A bemutató során lépésről lépésre láthatjuk, hogyan telepíthető és futtatható helyi gépen a modell, valamint hogy az miként kezel különböző környezeteket egyetlen modellként. Külön érdekesség, hogy az adatok alapján a szimuláció már a tanítás során szerves rész volt, nem csak későbbi bővítésként került bele.
A működés három fő tanítási szakaszban bontakozik ki: előtanulás, felügyelt finomhangolás és megerősítéses tanulás, így egyre pontosabb, konzisztens eredményeket ad. A videó több példát mutat arra, hogyan ‘képzeli el’ a modell a parancssori vagy éppen a webes környezet következő állapotát, valódi végrehajtás nélkül.
Felmerül, hogy vajon egy ilyen nyílt forráskódú modell mennyire állja meg a helyét a zárt, csúcstechnológiás rendszerekkel szemben, illetve mennyire használható tényleges helyettesítőként ügynökök tesztelésére vagy tanítására. Az is kérdés, milyen újdonságokat és nehézségeket tartogat az AI-alapú környezeti szimuláció, például a sebesség vagy a megbízhatóság terén.










