Frissen jelent meg a Google új Gemini Omni modellje, amely a mesterséges intelligencia és videókészítés világában újat ígér: multimodális inputokat – szöveget, képet, hangot, videót, rajzot – fogad, és ezekből generál mozgóképet. A felhasználók beszélgetésszerűen szerkeszthetnek, egyszerű utasításokkal formálhatják át a jeleneteket anélkül, hogy újra kellene kezdeniük a szerkesztési folyamatot.
A Gemini Omniflash kifejezetten a videók létrehozására koncentrál, míg a Gemini 3.5 Flash az intelligens ügynöki működésre. A funkciók és az elérhető sablonok széles választékot kínálnak: comic book, noir, pixelate, analyze me, video game – ezek mind sajátos, egyedi stílust adnak a készített tartalomnak.
Lenyűgöző a fizikai törvényszerűségek kezelése, a karakterek következetessége, és az, hogy a rendszer felismeri, hol érdemes módosítani (például hangulat, háttér vagy szín), miközben ügyel a főalak változatlanul hagyására. Az avatár funkció lehetővé teszi, hogy rövid felvétel alapján a saját arcunk és hangunk animált változata szólaljon meg különböző környezetekben, minden generált videóban digitális vízjel biztosítja az AI eredet átláthatóságát.
Produkciós munkafolyamatokban is helyet kaphat: eredeti, kézzel fogott felvételek atmoszféráját, színvilágát, stilizált hatását lehet finomhangolni, vagy több fotóból egységes mozgóképes montázs készíthető. Az időkorlát most 10 másodperc, hanggenerálás pedig egyelőre nincs, de a szerkesztési lehetőségek széleskörűek, gyorsak, és főként felhasználóbarátak.









