A
A
  • Angol
  • Magyar
  • 20 perc

Új AI fejlesztések lendítik fel a kreatív alkotást: agentikus munkafolyamatok és nyílt forráskódú lehetőségek

A legújabb AI fejlesztések izgalmas munkafolyamat-lehetőségeket, nyílt forráskódú modelleket és szorosabb integrációt kínálnak a kreatív és technológiai világok között.

Az AI világában izgalmas fejlemények zajlanak, és az elmúlt időszakban számos újdonság látott napvilágot. A Dreamina bemutatta az Octo-t, amely a Seadance 2.0-ra épülő új, agentikus és vászonalapú munkafolyamatokat kínál. Ez a kreatív eszköz már béta fázisban van, és lehetőséget ad történetmesélés, karakterprofilok, valamint storyboardok generálására, miközben számos különféle képalkotó modellt támogat.

A felhasználók változatos inputokat adhatnak meg, például irodai helyszíneket vagy szereplők karakterjegyeit, hogy az AI vizuális történetvázlatokat és karakterlapokat állítson elő. Bár az Octo rugalmassága előnyös, időnként pontatlanságokba is belefuthat – például nehézséget okozhat a konzisztencia megtartása vagy egyes jelenetek realisztikussá tétele.

Az Nvidia is jelentős bejelentést tett a Cosmos 3-mal, egy speciális AI világmodellel, amely fizikán és mozgásértelmezésen alapuló, realisztikusabb jelenetek generálását célozza. Az ilyen fejlesztések többek között robotikai vagy önvezető járműves alkalmazásokhoz készülnek, de már most érezhető a filmes és kreatív területekre gyakorolt hatásuk is.

Az open source színteret tovább bővíti a Bernini modell, amely a Google Omni nyílt alternatívájaként tervezett, komplex szerkesztési terveket előállítani képes AI. Emellett a Trippo Splat is kiemelkedik, amely kétdimenziós képekből 3D-asseteket állít elő, megkönnyítve a vizuális jelenetek és új világok alkotását független alkotók számára.

Az új rendszerekhez számos kreatív eszköz – például a Genspark vagy a Nano Banana Pro – is kapcsolódik. Ezek célja, hogy leegyszerűsítsék az alkotói folyamatokat, ötvözve a képalkotást, videószerkesztést, és akár az üzleti adminisztrációt is egy felület alatt. Kérdés, hogy ezek az új agentikus munkafolyamatok, fizikai AI-modellek és összetett, nyílt forráskódú rendszerek milyen irányba viszik az AI által támogatott alkotást, és hogyan segítik majd a kreatív közösséget.