Számos szövegből képet generáló modell létezik manapság, ám ezek között kevés biztosít precíz irányítást és kiszámíthatóságot. Az FIBO modell azonban pontos képgenerálást helyez előtérbe, nem csupán a kreatív ötletek megvalósítását.
Ennek a modellnek az egyik különlegessége, hogy részletes, akár több ezer szavas, strukturált feliratokon tanult. Ezáltal a felhasználó egészen pontosan meghatározhatja a képi paramétereket, például a világítást, a kamera szögeit vagy a kompozíciót is.
A videó bemutatja, hogyan telepíthető a FIBO modell helyileg Ubuntu rendszeren, NVIDIA RTX A6000 GPU-val. Telepítés közben szó esik a modell architektúrájáról, valamint extra funkcióiról, amelyek révén többféle módon is lehet vele képeket készíteni, finomítani vagy inspirációként használni meglévő fotókat.
Praktikus példákon keresztül láthatjuk, hogy egy rövid szöveges promptból milyen részletes JSON-alapú utasításokat képes generálni a rendszer. A demó során mód nyílik meglévő képek szerkesztésére, például egy függöny színének egyszerű megváltoztatására is.










