Két mesterséges intelligencia alapú képalkotó modell, a ChatGPT (GPT-4) és a Midjourney 7 áll egymással szemben ebben az alapos összehasonlításban. A készítő különféle utasításokat adott mindkét modell számára, hogy különböző stílusokban, témákban, portrék, akciójelenetek, absztrakt alkotások és sok más kategória mentén vizsgálja a teljesítményüket.
Részletesen kitérnek arra, hogy melyik rendszer hogyan kezeli az arcokat, kezeket vagy éppen a bonyolult részleteket, például tetoválásokkal, ékszerekkel és feliratokkal kapcsolatos kéréseket. Felmerülnek olyan érdekes kérdések is, mint hogy melyik képes a pontosabb szövegmegjelenítésre, hogyan boldogulnak ismert világsztárok vagy anime karakterek stílusának utánzásával, mi a cenzúra határa, egészen addig, hogy hogyan tudnak több jeleneten át azonos karaktereket visszahozni.
Elemzik a modellek esztétikai különbségeit, kreativitását, a személyre szabhatóságot, illetve a gyorsaság és felhasználói élmény különbségeit. Külön témaként merül fel a Midjourney testreszabási lehetősége, illetve a ChatGPT integrált képalkotási képességeinek használata más platformokon keresztül.
A tesztek rámutatnak, hogy mely területeken tűnik erősebbnek az egyik vagy a másik eszköz, illetve milyen kihívások és eddig megoldatlan problémák vannak a generált képekkel kapcsolatban, például a tömegjelenetekben található sok arc vagy az egyes karakterek konzisztenciája terén.