A
A
  • Angol
  • Magyar
  • 9 perc

AI varázs: 3D világok egyetlen fotóból a High World 2.0-val

A mesterséges intelligencia legújabb áttörése lehetővé teszi, hogy egyszerű fotók és videók alapján teljesen bejárható 3D világokat hozzunk létre, amelyeket akár játék- vagy filmes motorokban is használhatunk.

Képzeld el, hogy mindössze egy mondat begépelésével vagy egy átlagos fotó feltöltésével teljes 3D világokat hozhatsz létre, amelyeket nemcsak megnézni, hanem bejárni, szerkeszteni, sőt játék- vagy filmes motorokba is importálni lehet. Ez a napjaink egyik legizgalmasabb technológiai újdonsága, amely a mesterséges intelligencia erejét használja ki valódi, interaktív térterek előállításához.

A bemutatott modell, a Tencent High World 2.0, jelentősen túllép a hagyományos „videógenerátorokon”. Míg azok csak mozgóképekben gondolkodnak, ez a rendszer építhető, bővíthető 3D világokat készít szöveges leírás, egyetlen kép vagy akár rövid videó alapján. A technológia kulcsa az, hogy a kimenet nem puszta eljátszható tartalom, hanem megőrizhető, testreszabható tér.

A videó során a néző betekintést kap abba, hogyan működik a High World 2.0 gyakorlati telepítése és elindítása egy helyi gépen. Az architektúra több különleges modulból épül fel: panoráma generálás, útvonaltervezés, világ bővítés, majd végül teljes 3D kompozíció, amelyek mind hozzájárulnak a fotók vagy videók valósághű 3D-s újraalkotásához.

A demonstrációban szó esik a Gaussian splatting technikáról, a kameraállások pontos számításáról, mélységtérképekről, illetve arról, hogyan készül a végeredmény egyetlen AI által generált képből. Felmerülnek kérdések a lehetséges felhasználási területekről – játékfejlesztők, filmesek, szimulációk vagy akár robotikai alkalmazások – és arról, milyen új alkotói lehetőségeket nyit a tartós, szerkeszthető 3D világok megjelenése.