Két vezető generatív AI rendszer, a Google Veo 3.1 és az OpenAI Sora 2 új, jelentős frissítéseivel foglalkozik a videó. Ennek során az újdonságokat izgalmas példákon keresztül mutatják be, kitérve arra, milyen változásokat hoztak ezek a fejlesztések a videó- és képgenerálásban.
Az elemzés során összevetik a Veo 3.1 és a korábbi verziók képességeit, például a szövegből videó generálás minőségét és az audio fejlesztéseit. Szóba kerülnek új kreatív eszközök is, például az összetett jelenetépítés, az első és utolsó képkocka meghatározása, illetve a jelenet bővítése nyújtott jelenetekkel. Egyes funkcióknál felmerülnek kérdések a használhatóságról és az intuitivitásról is.
A Sora modell kapcsán kifejezetten érdekes, hogy hosszabb, akár 15–25 másodperces videók generálására is lehetőség nyílik, illetve hogy visszatért a storyboard funkció. Ezek az újdonságok a kreatív munkafolyamatokat bővítik és teszik rugalmasabbá.
A videó kitér a Recraft platformra is, amely professzionális képgenerálási eszközeit és új chat funkcióját mutatja be. Megjelennek a fantáziaalkotások zenemágia vezette világáról és különféle művészi stílusokról is, miközben az újítások szerepét és lehetőségeit vizsgálják.
Folyamatosan felmerülnek kérdések: vajon mennyire sikerült javítani a modellek realizmusát és konzisztenciáját, mik a legnagyobb újdonságok, illetve hogyan alakítják át ezek az eszközök a jövőbeli tartalomgyártást?