A
A
  • Angol
  • Magyar
  • 13 perc

Qwen-Image FLUX.1: Képgenerálás otthon az Alibaba új modelljével

Az Alibaba nyílt forráskódú képgeneráló modelljét mutatják be lépésről lépésre, valós tesztképekkel és gyakorlati példákkal.

Ebben a videóban egy vadonatúj, nyílt forráskódú képgeneráló és szerkesztő modellt mutatnak be, amely az Alibaba Qwen csapatától származik. Bemutatják, hogyan lehet ezt a Qwen-Image FLUX.1 modellt helyben telepíteni és elindítani egy Ubuntu rendszeren, különösen egy Nvidia RTX H100 GPU-val felszerelt számítógépen.

A készítő röviden áttekinti a Qwen 3 modellcsalád korábbi sikereit, kiemelve, hogy a Qwen-Image újításainak köszönhetően a képeken jelentősen csökkent az „AI-plasztik” hatás, így a generált vizuális tartalmak jóval valósághűbbek és részletgazdagabbak.

Kiemelik a modell technikai részleteit, így szó esik a kétcsatornás, szimultán jelentés- és képrészlet-megőrző architektúráról, valamint az MMD típusú háttérről és az MS Rope pozicionálási sémáról is. Ezek révén a modell képes szöveges prompt alapján valósághű képeket alkotni, szerkeszteni, sőt, szegmentálni is.

A videóban a felhasználó izgalmas példákat próbál ki: varázslatosan realisztikus állatportrék, összetett építészeti látványtervek, kalligráfia és emberi testrészek generálása – külön kihangsúlyozva, hogy a modell mennyire jól teljesít a tipikusan problematikus képelemeknél, például kéz- és lábábrázolásnál.

Felmerül a kérdés, hogy a Qwen-Image képes-e felülmúlni a jelenlegi piacvezető FLUX modelleket, illetve hogyan viszonyul a képgeneráló modellek közötti versenyben. Ezúttal kizárólag a telepítésre, alapfunkciókra és képminőségre koncentrálnak, de előrevetítik a következő videókban megjelenő kiegészítő szerkesztési, szegmentálási lehetőségeket is.