Az AI-alapú videógeneráció forradalmi fejlődésének aktuális állását és dinamikáját mutatja be a videó, kiemelve a Seedance 3.0-t, egy új mesterséges intelligenciára épülő rendszert, amely már hosszabb, akár 18 perces, koherens filmeket képes készíteni egyetlen prompt alapján.
A technológiai újítások között szerepel a párhuzamosan zajló audió- és videógenerálás, amit egy speciális, kettős elágazású diffúziós transzformátor (MMDIT) tesz lehetővé. Ezzel a fejlesztőcsapat, a Bite Dance Seed Research Team, jelentős előnyhöz jutott a vetélytársakkal, például a Google-lel és az OpenAI-val szemben.
A fejlesztés világszerte komoly iparági visszhangot váltott ki: a Disney és a Paramount Sky Dance szellemi tulajdon védelme érdekében jogi lépéseket tett, valamint több száz színész fordult a Kongresszushoz munkajogi védelmet kérve az AI térhódításával szemben. Közben kiszivárgott információk jelentek meg a Seedance 3.0 tudásáról, amelyek között a narratív memória-láncra és a költségcsökkentésre utaló állítások is feltűntek, azonban ezek megbízhatósága változó.
Érdekes összevetések hangzanak el a legújabb fejlesztésekkel kapcsolatban, különös tekintettel az árversenyre, a videóminőségre és a hosszú távú koherenciára. Felmerülnek továbbá olyan technikai kérdések, hogy miként lehet biztosítani a karakterek és környezetek állandóságát hosszabb jelenetekben, vagy hogy az új modellek valóban képesek-e forradalmasítani a rövid- és hosszú formátumú videók előállítási költségeit.










