Új virtuális világok teremtése a Google Genie 3-mal ✦ UMA

A Google DeepMind Genie 3 forradalmi módon hoz létre teljesen új, interaktív virtuális világokat képek és szöveges leírások alapján. Megnézzük, hogyan birkózik meg a rendszer egészen különböző karakterekkel és terek generálásával, valamint milyen hibák vagy lehetőségek rejtőznek ebben az új technológiában.

A videó izgalmas betekintést nyújt a Google DeepMind új fejlesztésébe, a Genie 3 nevű mesterséges intelligencia rendszerbe, amely képes teljes, interaktív világok generálására képek és szöveges leírások alapján. A bemutató során különféle referencia képeket és környezeti leírásokat használnak, hogy különböző karaktereket – például macskát, női alakot, vízilovat vagy farkast – helyezzenek el egyedi terekben, ahol a felhasználó szabadon mozoghat.

A felvételben érdekes kérdések merülnek fel azzal kapcsolatban, mennyire képes a mesterséges intelligencia valódi, fizikai érzést imitáló élményeket létrehozni a mozgás és az interakció során. Részletesen bemutatják, hogyan érzékeli és generálja a rendszer a fényt, a környezet dinamikáját vagy a különféle mozgásformák (vízben, sárban, erdőben vagy épületen belül) eltérő fizikai hatásait.

Felvetődik, hogy az animált világokban mennyire működnek hibátlanul az interakciók, vannak-e tipikus AI-hibák, például furcsán szinkronizált karaktermozgások vagy vizuális anomáliák. Emellett érintik, hogy az ilyen technológia milyen új lehetőségeket kínál játékfejlesztés, szimuláció vagy akár robotikai képzés terén, hiszen a rendszer képes végtelen számú, élethű környezetet előállítani.

Az alkotó teszteli azt is, hogy a Genie 3 mennyire alkalmas a komplexebb, első személyű nézetet igénylő helyzetek kezelésére, vagy hogyan birkózik meg jól ismert videojáték környezetek generálásával – egészen odáig, hogy képes-e futtatni egy klasszikus Doom 2 pályát. A fejlesztés egyes funkciói – például szkriptelhető események – egyelőre még nem mindenki számára elérhetők, de a bemutatóban szó esik ezek jövőbeli lehetőségeiről is.

Új virtuális világok teremtése a Google Genie 3-mal

Hasonló tartalmak:

3DO élménybeszámoló a MiSTer FPGA-n: játékteszt és technikai áttekintés

Írók technológiai vitája a Linus Tech Tips-nél: Mennyire értenek egyet a csapattagok?

DLSS5, Street Fighter dráma és a játékújságírás kihívásai

AI szingularitás küszöbén: az Nvidia, Anthropic és a Tesla formálják a jövőt

Az emberi ítélőképesség nélkül az AI vakon működik: a memóriakorlát és szervezeti tudás fontossága