Ebben az epizódban egy vadonatúj generatív AI képmodellel, a Flux.2 Klein 9B-vel ismerkedhetünk meg, amelyet a Black Forest Labs fejlesztett ki. A videó röviden bemutatja a modell technikai felépítését, hangsúlyozva a 9 milliárd paraméteres architektúra innovációját, kiemelve a figyelemre méltó sebességet, amit akár fogyasztói hardveren is el lehet érni.
A bemutató során megtudhatjuk, hogyan lehet a Flux.2 modellt egyszerűen telepíteni és helyben futtatni különféle szervereken, például Ubuntu rendszeren, nagy teljesítményű Nvidia RTX 6000 vagy H100 GPU-val. Részletesen követhetjük az installációs lépéseket, miközben szó esik a VRAM-igényekről, a felmerülő technikai kihívásokról és az optimalizáció lehetőségeiről is.
Sokféle gyakorlati példán keresztül tesztelik a modell teljesítményét: többféle promptot adnak meg (például fotórealista halászkéz, neonfényes tokiói utca, esőcseppektől borított whiskyspohár, utcazenész mozgásban), valamint különböző komplexitású, valósághű jeleneteket generálnak vele. A videóban az is kiderül, mennyire követi pontosan az utasításokat, és hogyan birkózik meg nehezebb szerkesztői, képmanipulációs feladatokkal.
Felmerül a kérdés, hogy vajon mennyire megbízható és sokoldalú a Flux.2 Klein 9B, különösen szövegből képet, illetve képből képet generáló funkcióiban. Több szempontból is elemzik, mire képes a modell: mennyire reálisak a képek, hogyan kezeli a fényt, anyagokat, emberi részleteket, vagy éppen a szövegalapú szerkesztéseket. Elgondolkodtató, hogy hol húzódnak a határai a Flux.2 jelenlegi képességeinek, és milyen irányban fejlődhetnek tovább ezek a modellek.









