Múlt héten egy új, rejtélyes mesterséges intelligencián alapuló képszerkesztő tűnt fel az LM Arena toplistáján Nano Banana néven, és gyorsan híre ment annak, milyen erős ez a modell. Sokan hamar elkezdtek találgatni, hogy tényleg a Google áll-e a háttérben, amit több, banános emojit posztoló Google-alkalmazott is alátámasztani látszott, mígnem hivatalosan is kiderült: a Nano Banana valójában a Gemini 2.5 Flash Image modell.
A szoftver több platformon is elérhető, például a Gemini alkalmazásban és weboldalon, de akár a Google AI Studio vagy az Adobe Firefly is beépítette, sőt, az LM Arena rendszerén keresztül is hozzá lehet férni. Az új képszerkesztő az egyszerű utasításszövegek mellett bonyolultabb, absztrakt kéréseket is képes értelmezni; például egy kép egyes részeinek kicserélése vagy kibővítése csak szöveges utasításokkal megoldható.
Felmerül az izgalmas kérdés, vajon mennyiben más vagy korlátozottabb a Gemini modell az LM Arena-hoz képest, illetve hogyan teljesít különböző felületeken. További érdekesség, hogy akár két referencia képet is felhasználhat, hogy új, egyedi jeleneteket hozzon létre. Ez új távlatokat nyithat a képszerkesztési lehetőségekben, ám felveti azt is a kérdést, hogy jelenleg mely funkciók érhetők el, és melyek nem minden platformon.
Több példával is bemutatják, hogy a képek szerkesztése akár egy egyszerű beszélgetéssel is megoldható, legyen szó ruhaszín-változtatásról vagy teljes nézőpontváltásról. Ugyanakkor látni, hogy még van hová fejlődni – például az arányok, objektumok vagy a valós helyszínek pontos felismerésében adódhatnak hiányosságok. A lehetőségeken túl a beszélgetés kitér arra is, mennyire érdekes, hogy a modell az intenzív AI-használat során kreatív, de néha meglepő vagy pontatlan eredményeket ad.