Az OpenAI bemutatta a legújabb, GBT Image 1.5 névre keresztelt képgeneráló modelljét, amely jelentős előrelépést hozott az előző verziókhoz képest. A videó során részletes tesztekkel hasonlítják össze az új modellt a piac egyik vezetőjével, a Nano Banana Pro-val. A fókusz a gyakorlati, széles körben elterjedt felhasználási módokon van: karakterek konzisztenciája, realizmus, infografikák, marketingszövegek kezelése, valamint különféle nehézségű promptok teljesítése.
Különböző feljavító tesztek szemléltetik, hogy a modellek miként kezelik az élesítést, színhelyreállítást és a részletesebb textúrákat. A valósághű képek generálásához kapcsolódó kísérletek rávilágítanak arra, mennyire képesek realisztikus arányokat, hibákat, természetes pózokat és tökéletlenségeket előállítani a szoftverek.
Az alkotó részletesen vizsgálja az infografikák készítését, a hosszú és összetett szövegek kezelését, valamint azt, hogy mennyire pontosan képesek betartani a helyesírási és tartalmi követelményeket a képeken belül. Szó esik összetett kérésről – például specifikus számú ujj, pontos idő egy órán vagy egy termék részletes infográfiája – és arról is, hogy melyik modell hogyan birkózik meg ezekkel a kihívásokkal.
Külön érdekes rész, hogy miként tudnak forgatókönyveket és néhány képből álló képnarratívákat generálni, továbbá bemutatásra kerül az is, hogyan lehet saját stílusokat keverni a Midjourney-ben, illetve ezt mennyiben tudják a másik két modell lemásolni. A videó marketinges és kreatív tartalomgyártáshoz kapcsolódó példákat is felhoz, valamint betekintést ad abba, mennyire használhatók ezek az eszközök céloldalak, reklámképek vagy karakterkövetkezetesség szempontjából.









