A
A
  • Angol
  • Magyar
  • 21 perc

Új szintre lép az AI-videó generálás az Alibaba WAN 2.5 megjelenésével

Újabb fordulóponthoz érkezett az AI-videó generálás: az Alibaba WAN 2.5 modellje jelentős újításokkal érkezik, kihívást intézve a Google piacvezető modelljeinek.

Az elmúlt hét izgalmas fejleményeket hozott az AI-videó generálás terén, ahol az Alibaba WAN 2.5 modellje jelentős figyelmet kapott. Ez az új videómodell több platformon érhető el, képes hangot, sőt párbeszédet is generálni, komoly kihívást állítva ezzel a Google VO3 számára. Nem mellesleg, néhány érdekes újdonságot is kínál, amelyeket példákon keresztül mutatnak be.

Megvizsgálják, hogyan teljesít a WAN 2.5 különböző generálási módban – legyen az szövegből videó vagy kép alapú animáció. Egyedi részletek – mint az automatikus feliratozás, a kameramozgások, a felbontás választhatósága, valamint az időtartam testreszabhatósága – szintén szóba kerülnek. Ugyancsak előkerülnek a rendszer hiányosságai, például a helyenként döcögős hangszinkron vagy a furcsa hanghatások, de a pozitívumok között szerepel a megfelelő háttér-koherencia és a kontextuális beillesztések is.

Tárgyalják a különféle költségmodelleket és elérhetőségi csomagokat, valamint felvetődnek kérdések az open source jövővel kapcsolatban. A Dreamina hosszabb videógenerációs lehetőségei és annak kihívásai – például a stílus- és átmenetegység, valamint a több kulcskocka használata – ugyancsak szerepet kapnak. Felmerül, hogy vajon mennyit fejlődhetnek még ezek a rendszerek, és hogyan reagálnak a piaci versenyre.

Külön blokkban kerül fókuszba a Google Flow Platform néhány új funkciója, például a Mixboard, amely főként hétköznapi felhasználókat céloz meg, valamint bemutatják a prompt bővítő és képszerkesztő lehetőségeket. A videó végén felvetődik, miként lehet ezeket az eszközöket alkalmazni akár saját alkalmazásfejlesztésre vagy komplex asset-menedzsmentre.