A
A
  • Angol
  • Magyar
  • 9 perc

Új szintre lépett a képgenerálás: bemutatkozik a FIBO modell

A videóban egy új, nagy precizitású, JSON-alapú képgeneráló modellt, a FIBO-t próbálják ki, amely kiemelkedően jól kontrollálható és részletes képeket hoz létre, akár hosszú, strukturált utasítások alapján is.

Számos szövegből képet generáló modell létezik manapság, ám ezek között kevés biztosít precíz irányítást és kiszámíthatóságot. Az FIBO modell azonban pontos képgenerálást helyez előtérbe, nem csupán a kreatív ötletek megvalósítását.

Ennek a modellnek az egyik különlegessége, hogy részletes, akár több ezer szavas, strukturált feliratokon tanult. Ezáltal a felhasználó egészen pontosan meghatározhatja a képi paramétereket, például a világítást, a kamera szögeit vagy a kompozíciót is.

A videó bemutatja, hogyan telepíthető a FIBO modell helyileg Ubuntu rendszeren, NVIDIA RTX A6000 GPU-val. Telepítés közben szó esik a modell architektúrájáról, valamint extra funkcióiról, amelyek révén többféle módon is lehet vele képeket készíteni, finomítani vagy inspirációként használni meglévő fotókat.

Praktikus példákon keresztül láthatjuk, hogy egy rövid szöveges promptból milyen részletes JSON-alapú utasításokat képes generálni a rendszer. A demó során mód nyílik meglévő képek szerkesztésére, például egy függöny színének egyszerű megváltoztatására is.