A
A
  • Angol
  • Magyar
  • 11 perc

Új lehetőségek az AI-val: képeket rétegekre bontó Qwen Image Layered modell

Az új Qwen Image Layered modell bemutatja, miként lehet mesterséges intelligenciával egyetlen képből szerkeszthető rétegeket előállítani, megkönnyítve a pontos képszerkesztést.

Az interneten található legtöbb kép egyetlen rétegben, „lapos” formában jelenik meg, ahol a háttér, a szövegek és a személyek egyetlen képként olvadnak össze. Ez nagy kihívást jelent a mesterséges intelligencia alapú képszerkesztés során, hiszen például egy személy áthelyezése vagy egy háttérelem módosítása gyakran természetellenes eredményhez vezethet.

A professzionális képszerkesztő szoftverek, mint a Photoshop, rétegeket használnak, hogy minden elem külön-külön szerkeszthető maradjon. Az új Qwen Image Layered nevű modell képes automatikusan elkülöníteni ezeket a rétegeket egy lapos képből, így az AI-alapú szerkesztés pontosabbá és megbízhatóbbá válhat.

Egy helyi rendszeren történő telepítést és futtatást is bemutat a videó, például Ubuntu operációs rendszeren, Nvidia H100 GPU-t használva. Az alkalmazás lehetővé teszi a képek feltöltését, azok rétegekre bontását és az eredmény exportálását különféle formátumokba.

A bemutató során a modell architektúrája is szóba kerül: diffúziós modelleken alapul, és kifejezetten rétegbontásra lett fejlesztve. Részletesen ismertetik, hogyan képes a modell akár tetszőleges számú réteg létrehozására, továbbá hogyan végezhető el további bontás a különböző rétegeken belül. A példákon keresztül az is láthatóvá válik, hogy a modell miként kezeli a szövegek vagy komplex objektumok elkülönítését a képen belül.

Felmerül a kérdés, jelent-e kihívást a hagyományos képszerkesztők, például az Adobe számára egy ilyen AI-alapú megoldás, és hogy miként változtathatja meg a grafikusok és tervezők mindennapi munkáját. A szerkeszthető rétegek automatikus előállítása új lehetőségeket teremt, illetve felveti az alkotás és kreativitás, valamint a technológia kapcsolatának aktuális témáit is.