A
A

Csak YouTube-on nézhető meg

  • Angol
  • Magyar
  • 24 perc

Google Genie 3: Interaktív univerzumok pár szavas promptokból

A Google Genie 3 fejlesztése új szintre emeli az interaktív világmodellek lehetőségeit: néhány szavas promptból teljesen bejárható, dinamikus univerzumokat generálhatunk, melyek számos kreatív alkalmazási területet nyithatnak meg.

A Google legújabb fejlesztése, a Genie 3 világmodell került fókuszba ebben a videóban, amely képes pár szavas szöveges utasításokból teljesen interaktív univerzumokat generálni. A felhasználó maga alakíthatja ki a környezetet és az eljátszható karakterek jellemzőit, majd szó szerint bejárhatja az így létrejött világokat.

Különös hangsúlyt kap a rendszerben rejlő váratlan, felbukkanó képességek vizsgálata, például hogyan képes a modell érzékelni és szinkronizálni különböző nézeteket – például egy miniatűr térképet és a valós környezetet egyszerre. A teszt során többféle szcenárió, például hátborzongató elhagyott épületsor, víz alatti jelenet vagy történelmi fotók világai is kipróbálásra kerülnek, bemutatva az atmoszferikus effektusokat és a technológia rugalmasságát.

Az interjúk részben megszólalnak a DeepMind vezető kutatói is, akik betekintést adnak a fejlesztési folyamatba, mesélnek kedvenc felhasználói élményeikről, valamint arról, hogy a közönség visszajelzése milyen irányba formálhatja még a projektet. Felvetődnek olyan kérdések is, hogy mik lehetnek a legizgalmasabb jövőbeli felhasználási területek, miben segíthet ez a filmkészítés, játékfejlesztés vagy épp az oktatás számára, és vajon hogyan alakíthatja át a kreatív tartalomgyártást.

Körbejárják a technológia jelenlegi korlátait, például a generált jelenetek hosszának mesterséges limitjét vagy a felhasználói kontroll lehetőségeit. Érdekes kérdések merülnek fel a hosszabb, folyamatos élmények kialakításáról, a világmodellek jövőbeli fejlődéséről, valamint arról, milyen új, eddig ismeretlen alkalmazási módokat fedezhetnek fel a közösség tagjai.