Az utóbbi években az MI-képességek robbanásszerűen fejlődtek, amit a Google DeepMind új fejlesztése, a SIMA 2 mesterséges intelligencia-ügynök is bemutat. Ez az AI nem csupán játékokat játszik – képes tanulni, fejlődni, jobban alkalmazkodni és akár a játék világáról vagy céljairól is beszélgetni a felhasználókkal.
Szokatlan módon a SIMA 2 az emberekhez hasonló módon, egérrel és billentyűzettel, vizuális tömbökből kiindulva navigál a játékokban. Több száz különböző képességet sajátított el, például járművezetést, építkezést vagy felfedezést, miközben folyamatosan értékeli és javítja a saját teljesítményét. Egy érdekes kérdésként merül fel, hogy mi értelme van annak, ha egy MI játékokat tanul meg: a válasz az általánosíthatóságban keresendő, ugyanis ezek a tudások átültethetők a valós világba is.
A videó rávilágít arra, hogy a SIMA 2 működésének kulcsa a Gemini modell, amely nemcsak a játékos utasítások megértésében, hanem a célok felismerésében és rugalmas végrehajtásában is kiemelkedő. Érdekes párhuzamok vannak arra vonatkozóan, hogyan segítheti mindez a robotikát, illetve felmerül a kérdés is: elérhető lesz-e valaha, hogy egy ilyen univerzális AI-modell képes legyen mindenféle mozgó eszközt irányítani?
Kiemelt téma még a „Genie 3” nevű rendszer, amely szöveges leírásokból generál teljesen új, interaktív világokat, amelyekben a SIMA 2 még soha nem látott környezetekben is fejlődhet. Ez azt jelenti, hogy végtelen számú, dinamikusan létrehozott „játszótér” áll rendelkezésre az MI tanulásához.
Felmerül azonban több probléma: a hosszú távú tervek megvalósításának nehézségei, a rövid memória, a komplex feladatmegoldás kihívásai. A beszélgetés során a videó rámutat, milyen gyorsan közelít az MI a humán szinthez, és felteszi a kérdést, mennyire különlegesek a mi képességeink valójában – képes lesz-e egy jövőbeli MI valóban felülmúlni bennünket?










