A
A
  • Angol
  • Magyar
  • 19 perc

Új AI modellek az X-től a zenén át a 3D-ig: Grock, Midjourney és Eleven Labs fejlesztések

Az X saját, Grock nevű videómodellel bővítette kínálatát, miközben a Midjourney HD minőségű AI-videót, az Eleven Labs pedig új zenegenerátort mutat be. A videó összeveti a friss fejlesztéseket, vizsgálja az etikai kihívásokat és a kreatív lehetőségeket.

Az X (korábban Twitter) saját Grock videómodellel lépett a mesterséges intelligencia piacára, amely már most széles körű vitákat váltott ki a sajtóban. A frissen elérhető modell alapvetően szöveg- vagy képalapú videógenerálást tesz lehetővé, több üzemmóddal, köztük a vitatott „spicy” funkcióval. Ez utóbbi miatt számos, ismert személyeket ábrázoló, nem teljesen biztonságos videóról jelentek meg hírek, ám a legtöbb eredmény inkább furcsa, stilizált vagy technikailag elnagyolt, mintsem valódi deepfake élményt ad.

Közben szó esik más AI-alapú kreatív eszközökről is. A Midjourney videó immár HD minőségben is elérhető, igaz, jóval magasabb áron és szigorúbb hozzáférési feltételekkel. Így felmerül a kérdés, hogy megéri-e az extra minőség. Összehasonlításra kerülnek a különböző kimenetek és az ár-érték arány.

Az AI-zene területén az Eleven Labs most indította el saját zenegenerátor szolgáltatását, amely figyelemre méltó eredményeket produkál mind a hangszerelés, mind a vokál szintjén – bár jelenleg főleg gyors, egyedi dalok készítésére alkalmas. Kiemelt szerepet kap a Producer AI is, amely most már szinte zenei segédként teszi lehetővé a dalok kreatív átalakítását, énekcserét és új hangszeres szekciók generálását.

A videó bemutatja a Morphic nevű új, 3D-s szerkesztési funkcióval bővült platformot, amellyel akár látványos kameramozgások és vágások is leképezhetők AI segítségével. Végül a Leonardo új képgeneráló modellje, a Lucid Origin kerül fókuszba, különféle stílusú és minőségű képekkel. A felmerülő kérdések közé tartozik, hogy mennyire állják meg a helyüket ezek az újdonságok a gyakorlatban, milyen veszélyei és lehetőségei vannak a nyilvánosan elérhető AI-videó- és zenemodelleknek, illetve hogyan befolyásolják a kreatív munkafolyamatokat.