A
A
  • Angol
  • Magyar
  • 23 perc

Google Gemini 2.5 Flash teszt: Képgenerálás és fotómanipuláció mesterfokon

Bemutató és részletes próba a Google új Gemini 2.5 Flash (Nano Banana) képgeneráló MI-járól, változatos fotómanipulációs feladatok segítségével.

Ebben a videóban a készítő a Google új, Gemini 2.5 Flash, korábbi kódnevén ‘Nano Banana’ nevű mesterséges intelligenciáját teszteli, amely képgenerálásra és szerkesztésre alkalmas. A nézők bepillantást nyerhetnek abba, hogyan lehet ezzel például hajszínt változtatni, hátteret módosítani, graffiti stílusú szöveget vagy elképzelt páncélt készíteni.

Részletesen bemutatásra kerül, mennyire meggyőzően tüntet el vagy szerkeszt át embereket képeken, hogyan lehet tárgyakat hozzáadni vagy elvenni, megváltoztatni a fények irányát, vagy akár stílusokat, például barátságos vagy fenyegető jeleneteket létrehozni. Fő kérdésként merül fel, hogy mennyire képes a karakterkonzisztenciára, és hogyan birkózik meg a bonyolult háttérinformációk kitöltésével.

A Las Vegasban tartott AI4 konferencián készült képeken keresztül a szerző teszteli a képalkotó AI lehetőségeit, többek között emberek eltávolításával, aranyfogak hozzáadásával vagy történelmileg hiteles portrék javításával, újraszínezésével is próbálkozik. Felvetődik, hogy a modellek meddig képesek megtartani az arc- és testalkat jellemzőket, illetve hol vannak a határok az AI szerkesztési képességeiben.

Végigveszi, hogyan működik a modellek iteratív változtatása, például számos képmanipulációval (Friends, Star Trek vagy Fallout univerzumban való áthelyezés), valamint a különböző márkák, helyszínek (például Las Vegas, Bellagio, MGM Grand, Central Perk) is megjelennek a tesztelés során. Felmerül a kérdés, miként alakíthatja át az ilyen jellegű AI-eszközök fejlődése a fotómanipulációt és a hétköznapi képszerkesztést.