A friss fejlesztések középpontjában a Cling 2.6 áll, amelynek legkiemelkedőbb újdonsága a natív hanggenerálás. Az újdonság révén a felhasználók nem csupán képi, hanem hangalapú tartalmat is létrehozhatnak, legyen szó akár párbeszédekről, hanghatásokról vagy egyedi zenei megoldásokról.
A rövid példák során a narrátor különféle szituációkat, szövegeket, sőt, hiphop stílusú szövegelést is tesztel a rendszerben. Megjelennek népszerű filmes és sorozatos utalások, mint például a Twin Peaks, és kiderül, hogyan birkózik meg a rendszer különböző stílusokkal, a dialógusok precizitásával vagy éppen a nyelvi választékkal (angol és kínai).
A hanggal kapcsolatos kihívások, mint a színészhang változása, merev előadásmód vagy néha összekeveredő karakterpárbeszédek, felvetik a kérdést: mennyire lehet természetes és koherens egy ilyen AI által generált tartalom? Ugyanakkor a kreatív lehetőségek számtalanok, nem utolsósorban a szórakoztató vagy abszurd műfaji kísérletezések terén.
Mindezt kiegészíti a Bike Dance Cdream 4.5 képalkotó és képszerkesztő modell bemutatása, amely a vizuális generálás terén mutat be évtizedeken átívelő stílusváltásokat, pontosabb részletekkel, megbízhatóbb szöveggenerálással, valamint fejlődő világértelmezéssel. Megismerhetjük, miként változik egyetlen karakter és utcai jelenet kinézete az 1970-es évektől egészen a jövőbe képzett jelenetekig.
Felmérésre kerül néhány speciális munkafolyamat és prompt technika (mint a ‘Nano Banana’), amelyek segítségével akár filmes jellegű storyboardokat vagy képkockák sorozatát is AI-jal generálhatjuk. Ez új távlatokat nyit a történetmesélés, kreatív tervezés, valamint az AI-alapú tartalomgyártás világában. További izgalmas fejlesztések, mint a Runway Gen 4.5, még csak a láthatáron vannak, de a folyamatos fejlődés újabb lehetőségeket ígér.










