A
A
  • Angol
  • Magyar
  • 11 perc

Többszereplős dialógus szinkronizálása AI-val: a Cling 3.0 forradalma

A videó bemutatja, hogyan lehet több karaktert egyidejűleg tökéletesen szájmozgásra szinkronizálni a Cling 3.0 segítségével, akár átfedő, valósághű párbeszédekkel és mozgó jelenetekkel.

Milyen kihívásokkal szembesülnek jelenleg az AI filmszerkesztők, amikor több karaktert mozgatva átfedő dialógusokat kell szinkronizálniuk? A videó ezt a problémát járja körül, kiemelve, hogy a legtöbb eszköz csak egyetlen arc pontos szinkronizálására képes, míg a manuális utómunka hosszadalmas és bonyolult folyamat.

Az új Cling 3.0 rendszer bemutatásra kerül, amely lehetővé teszi akár négy karakter szimultán, mégis elkülönített szájmozgás-szinkronizálását egyetlen felületen, anélkül, hogy exportálni vagy bonyolult idővonalakat kellene kezelni. A narrátor bemutatja, hogyan működik a folyamat két, majd három és végül négy fős beszélgetések esetén, illetve rávilágít arra, hogy minden karakter hangja és szájmozgása külön pályára kerül, így akár átfedő, egymást félbeszakító beszéd is tökéletesen lemodellezhető.

Részletesen kitér a mozgásrétegezésre is: hogyan lehet egy statikus jelenetet életre kelteni finom fejmozgásokkal, légzéssel, lassú kameramozgással, majd ezekhez párosítani a pontos párhuzamos dialógusokat. Vizsgálja a rendszer teljesítményét különböző stílusok esetén is, legyen szó realisztikus, animéről, sőt akár nem emberi, 3D-s lényszerű karakterekről.

Foglalkozik azzal is, hogy melyik funkcióhoz szükséges a Pro verzió, miként gyorsul fel a gyártási folyamat, és milyen minőségben jeleníthető meg akár narratív, akár reklám vagy magyarázó tartalom a platform segítségével. Felvetődik a kérdés, hogy hol vannak a rendszer korlátai extrém stilizáció esetén, és mi mindenre használható fel az új munkafolyamat.