Egy új, nyílt súlyú, szöveg-alapú képgeneráló modellt mutatnak be, amelyet a Kria AI és a Black Forest Labs fejlesztett ki. A Flux.1 Krea névre keresztelt modellt kifejezetten a természetes kinézetű, AI-ra jellemző hibák nélküli képek generálására tervezték. A fejlesztők célja, hogy túllépjenek az élettelen bőrszínek, túlvezérelt textúrák és a gyakori homályos háttér problémáin, amelyek más AI-alapú képgeneráló eszközöknél gyakran jelentkeznek.
A bemutatóban részletesen ismertetik a modell architektúráját, amely egy 12 milliárd paraméteres diffúziós transzformátoron alapul, és amely teljes mértékben kompatibilis a jelenlegi Flux One Dev ökoszisztémával. Külön hangsúly kerül arra is, mit jelent az „open weight” licenc, és milyen fontos különbségek vannak az open source és open weight fogalmak között.
A telepítési útmutató lépésről lépésre végigvezeti a nézőt azon, hogyan töltheti le és integrálhatja a modellt a ComfyUI munkafolyamatába a helyi gépen — bemutatva a szükséges modulfájlokat (modell, VAE, két szövegkódoló), a rendszerkövetelményeket, a VRAM fogyasztást és a főbb konfigurációkat is. Emellett kitér arra, hogy milyen promptokra képes a Krea válaszolni, és hogyan viszonyul elődjéhez, a Flux One Devhez, különböző vizuális példákon keresztül összehasonlítva a generált képeket.
Felmerülnek izgalmas kérdések: mennyire tudja követni az összetett szöveges instrukciókat a modell? Hogyan tudja feldolgozni a különböző kultúrákat, témákat vagy összetett vizuális elemeket, például kezeket és lábakat, amelyek hagyományosan problémásak az AI-ok számára? Milyen újdonságokat nyújt a természetes hatás elérésében?