Napjainkban az AI-alapú szájmozgás-szinkronizáló eszközök új szintre léptek: több szereplő esetén is megoldható a természetes párbeszéd, akár egyetlen fényképen is. A bemutatott módszerrel nemcsak emberek, hanem állatok vagy akár anime karakterek is „megszólaltathatók”, ami sok eddigi megoldás számára komoly kihívást jelentett.
A bemutatott munkafolyamat részletesen végigvezet azon, hogyan lehet egyetlen vagy akár négy karakter szájmozgását egyszerre, időzítetten irányítani. Mindegyik szereplő saját hangot kap, és a szerkesztőben pontosan beállítható, mikor szólaljanak meg, sőt: egymás szavába is vághatnak, ami a hiteles mozgás mellett dinamikusabb párbeszédet eredményez.
Külön érdekesség, hogy a speciális, úgynevezett Pro móddal animált csoportképek készíthetők, a szoftver képes felismerni és szinkronizálni akár három-négy szereplőt is. A videó azt is bemutatja, hogy különböző arcábrázolások – például anime- vagy állatfigurák – esetén is működik a lip sync, valamint részletes tippeket ad a hangok létrehozásához és a beszéd-időzítéshez.
A haladó felhasználók számára lehetőség nyílik mozgóképet is importálni, így a szájmozgáshoz illő finom arcanimációk vagy háttérmozgás is hozzáadható. Mindehhez nincs szükség komoly videoszerkesztési ismeretekre vagy drága eszközökre; a rendszer a felhasználó által feltöltött képek, hangok és karakterek alapján néhány perc alatt elkészíti az animált jelenetet.
Felmerül a kérdés, vajon mennyire lehet élethű és változatos egy ilyen csoportos animáció, mik a határai az automatikus felismerésnek, és milyen kreatív lehetőségeket nyit azok számára, akik eddig csak statikus fotókkal dolgoztak. A videó részletesen vizsgálja ezeket a témákat, és gyakorlati tippekkel illusztrálja az eljárást.








