A
A

Csak YouTube-on nézhető meg

  • Angol
  • Magyar
  • 8 perc

Gyors helyi képgenerálás mesterséges intelligenciával CPU-n

Bemutató arról, hogyan futtathatók stabil diffúziós képgeneráló modellek gyorsan, teljesen ingyen és helyileg, akár GPU nélkül, CPU-n is különféle AI-gyorsítási módszerek és eszközök segítségével.

Napjainkban egyre többen keresik a lehetőséget, hogy mesterséges intelligencia segítségével helyileg, ingyenesen és offline módon képeket generáljanak. A bemutatott megoldás főként azok számára lehet érdekes, akik nem rendelkeznek erős GPU-val, mégis gyors, minőségi képgenerálást szeretnének végezni CPU-n vagy mesterséges intelligenciára optimalizált PC-n.

Az ismertetett projekt nyílt forráskódú, és különféle gyorsítási technikák és optimalizációk révén teszi lehetővé a stabil diffúziós modellek futtatását szerényebb hardveren is. Az eljárás során kifejezetten hatékony modellváltozatokat – például LCMS-t, azaz „latent consistency model”-eket – használnak, amelyek akár néhány lépésben is képesek jó minőségű képet alkotni. Külön szó esik a diffúziós lepárlásról, amely a zajcsökkentő folyamatot egyszerűsíti a gyorsabb eredmény érdekében.

A videóban említésre kerülnek olyan további bővítési lehetőségek, mint a LoRa támogatás, amely segítségével egyszerűen lehet hangolni és testreszabni az AI modellt, vagy a ControlNet, amely plusz inputok bevonásával (például élek vagy mélységi térképek) irányíthatja a képalkotást. További érdekesség az is, hogy mindezek a lehetőségek lokálisan, akár egy Ubuntu rendszeren is egyszerűen telepíthetők és indíthatók.

A demonstráció során bemutatják, hogyan lehet szövegből képet, képből képet vagy képi variánsokat generálni, miközben a rendszer erőforrásigényét is szemléltetik – kiemelve, hogy a CPU- és memóriahasználat mérsékelt marad. Felmerülnek kérdések a minőség, gyorsaság és testreszabhatóság kapcsán is, de a végső következtetés nélkül csupán felvillantva a témák összetettségét.