Az új HiDream-O1-Image képalkotó modellt mutatja be a videó, amely lokálisan futtatható a ComfyUI segítségével. Az elhangzó instrukciók lépésről lépésre vezetik végig a nézőt a modell letöltésén, telepítésén és a szükséges kiegészítők integrálásán, valamint beszélnek a megfelelő GPU-követelményekről is.
Különböző képalkotási példákon keresztül ismerhető meg, hogyan boldogul a modell eltérő promptokkal: többféle stílusban, műfajban és tematikában – a képregénycsíktól, pixel art karaktereken, portrékon át egészen diorámákig vagy tájképekig – készítenek képeket, kiemelve az új architektúra előnyeit, illetve a tipikus nehézségeit.
A fejlesztések középpontjában a pixel-szintű egységesített transzformátor áll, amely képes a szöveget, a képet és a kondicionáló inputokat egy közös tokenszintű térben kezelni. Ezzel párhuzamosan említésre kerülnek benchmarkok, a prompt agent működése és a munkafolyamaton belüli beállítások is. Ugyanakkor nyitva marad a kérdés, mennyire képes a modell a komplex vizuális részletek kezelésére, illetve hogyan teljesít jól vagy éppen gyengébben bizonyos speciális feladatoknál.









