A
A

UMA hamarosan bemutatkozik

  • Angol
  • Magyar
  • 23 perc

Google Veo V3: Új generációs AI-videómodell a kreatív tartalomgyártásban

A Google Veo V3 egy új generációs mesterséges intelligencia alapú videómodell, amely egyszerre képes videót, zenét és szinkronizált beszédet generálni, forradalmasítva ezzel a kreatív tartalomgyártást.

A Google új, mesterséges intelligencia alapú videómodellje, a Veo V3 forradalmasítja a generatív AI-videók világát. A fejlesztés sokrétűen kombinálja a videót, a hangeffekteket, a zenét és a párbeszédet, mindezt egyetlen, összefüggő kimenetként. Ez jelentős előrelépést jelent a párbeszédek generálásában, különösen a szinkronizált ajakmozgás és az arcmozdulatok pontosságában.

A felhasználók egyszerű szöveges promptokra is meglepően összetett jeleneteket kapnak, ahol a modell automatikusan kiegészíti a hiányzó elemeket. Különböző szituációkat, például slam poetry-t, stand-up komédiát, aktivista beszédet, főzőműsort és még podcastjeleneteket is képes élethűen létrehozni, akár ismert vagy kitalált karakterekkel is. Emellett a platform támogatja a gyors jelenetváltást és mozgásokat, de néha furcsa eredményeket is produkál, főleg összetett mozgásoknál vagy több karakter esetén.

A Flow névre keresztelt felület további modulokat is kínál: szöveg- és képalapú videókészítést, különálló karakterek és objektumok beimportálását, valamint a jelenetek meghosszabbítását. Az „összetevők” funkcióval például karaktereket és háttereket kombinálhatnak a felhasználók, míg a „kiterjeszt” vagy „ugrás ide” lehetőségekkel új jeleneteket vagy jelenethosszabbítást próbálhatnak ki – bár ezek egyelőre korlátozottan működnek hanggal vagy összetett jelenetekkel.

A tesztelés során felmerülő gyengeségek közé tartoznak: véletlenszerűen generált feliratok, furcsa szünetek, helytelen modellváltások és a mozgásábrázolás korlátai, amelyek bizonyos kihívások elé állítják a felhasználókat. Különösen az image-to-video funkció eredményei maradnak el a várakozástól, főként, ha következetesség vagy részletes vezérlés szükséges.

Bár a modellhez való hozzáférés egyelőre csak az Egyesült Államokban, prémium előfizetés mellett lehetséges, a Veo V3, a Flow platform, valamint a különböző kapcsolódó eszközök egyértelműen kijelölik a generatív AI-videók új irányát. Az összetett médiaelemek egyszerre történő generálása újszerű kreatív lehetőségeket nyit meg, miközben új kérdéseket vet fel a technológia határaival, árazásával és elérhetőségével kapcsolatban.