Ezen a héten a kreatív mesterséges intelligencia világában egy meglepő és szórakoztató fejlemény kavarta fel az állóvizet: a Nano Banana nevű új generatív képszerkesztő modell, amely a Google legfrissebb fejlesztéseihez kapcsolódik. Különös figyelmet kapott a Google legújabb bemutató eseménye, ahol a Nano Banana, vagy ahogy hivatalosan nevezhetik, a Gem Pix elsőként a Pixel 10-es telefonok képjavító alkalmazásaként jelent meg, bemutatva, hogyan képes újramodellezni és átalakítani fotókat akár egészen drámai módon is.
A videóban izgalmas témák merülnek fel, például: hogyan lehet egy AI-alapú szerkesztővel bonyolult részleteket és perspektívákat megváltoztatni egy képen? Mikor válik ez a technológia elérhetővé más platformokon is? Milyen új kreatív lehetőségeket kínál a Flow vagy a Google Photos integráció? A bemutatott példák rávilágítanak arra, hogy a mesterséges intelligencia már képes teljes jeleneteket vagy storyboardokat is generálni egyetlen fotóból kiindulva, egészen impresszív részletességgel.
A Runway oldalán is jelentős fejlesztéseket mutatnak be: új hangmodulációs funkció, kibővített együttműködés a Google-lal, amely lehetővé teszi, hogy a felhasználók V3 típusú videókat generáljanak közvetlenül a Runway platformján, igaz, egyelőre csak kredit alapon. Emellett külön szó esik a Runway „Game Worlds” bétájáról is, ahol szövegalapú AI-játékokat kísérleteznek képgenerálással kombinálva, tovább bővítve az AI kreatív alkalmazásainak lehetőségeit.
A videó rávilágít arra, hogy az AI-alapú képszerkesztéstől és videógenerálástól kezdve a hangmanipuláción át egészen az interaktív AI-játékokig egyre több eszköz válik elérhetővé, miközben a szolgáltatások ára és hozzáférhetősége is folyamatosan változik. Több kérdést is felvet, például: milyen veszélyei lehetnek a csaló weboldalaknak, amelyek hamis AI-szolgáltatásokat árulnak? Hogyan befolyásolják ezek a fejlesztések a kreatív szakmákat?