A
A
  • Angol
  • Magyar
  • 9 perc

Láncolt MI-alkalmazások készítése Daggerrel: egyszerű és átlátható folyamatok készítése Pythonban

A Dagger nyílt forráskódú Python könyvtárával egyszerűen készíthető, vizuálisan is áttekinthető és könnyen hibakereshető MI-alkalmazás pipeline, ahol több Gradio vagy Hugging Face modul kapcsolható össze.

Komoly mesterséges intelligencia (MI) alkalmazások készítése során gyakran szükséges több modellt egymás után láncolni, például először egy képet generálni, majd eltávolítani a hátterét, végül pedig 3D-s verzióvá alakítani. Ezeket a folyamatokat azonban nehéz visszakövetni és módosítani, főként ha a hosszú folyamatok során valamelyik lépés hibát jelez.

A bemutatott Dagger eszköz egy Python alapú, nyílt forráskódú könyvtár, melynek segítségével gradio alkalmazásokat, gépi tanulási modelleket és egyedi függvényeket lehet könnyedén összekapcsolni. A felhasználó nem vizuális szerkesztőben, hanem Python kódban írhatja meg az adatfolyamot, ezt követően a Dagger automatikusan létrehoz egy vizuális canvas-t, ahol minden lépés kimenete ellenőrizhető és módosítható.

A rendszer kiemelten támogatja a Gradio integrációt, és bármely nyilvános Hugging Face Space modul bevonható. Az elkészült munkafolyamat állapota el is menthető, így később folytatható. A videó részletesen bemutatja, hogyan készül egy képből 3D-s objektumot előállító pipeline: először háttér-eltávolítással, utána képkicsinyítéssel, majd egy flux-modellen keresztül történő továbbfejlesztéssel, végül a Trellis 2 modellel történő 3D-s átalakítással.

A bemutató során szóba kerül a könyvtár telepítése, a Python környezeti beállítások, valamint az egyes node-ok (folyamatelem) szerepe. Bemutatásra kerül az is, hogyan lehet hibákat nyomozni a vizuális workflow-n keresztül, és milyen előnye van annak, hogy minden lépés önállóan is végezhető és ellenőrizhető.