A
A
  • Angol
  • Magyar
  • 9 perc

Qwen-Image-Edit: Új innovációk a mesterséges intelligencia alapú képmanipuláció terén

A Qwen-Image-Edit mesterséges intelligencia alapú képmanipulációs modell legújabb fejlesztéseit, látványos példáit és a mögöttes technológiát mutatja be a videó.

Kína vezető kutatólaboratóriumai most jelentős fejlesztést mutattak be a Qwen-Image-Edit nevű képmanipulációs modelljükben. Az új változat lehetővé teszi, hogy természetes nyelvi utasítások alapján képeket szerkesszünk, miközben erősen támaszkodik a diffúziós képgenerálás legmodernebb eljárásaira.

Egyes példák során a néző betekintést nyerhet abba, hogyan képes a modell különböző kultúrákhoz igazodó, részletes jeleneteket generálni – például hagyományos kínai és ausztrál esküvői fotókat, ikonikus helyszínelemeket beépítve, mindezt a felhasználó szöveges leírása alapján. Érdekes kérdést vet fel, hogy a rendszer mennyire tudja pontosan visszaadni az arcjellemzőket és a hangulati részleteket egy-egy szerkesztés során.

Az aktuális kiadásban öt jelentős fejlesztést említenek, többek között a természetesebb árnyékok és fényjáték, illetve a geometriai pontosság javítását. Ugyanakkor továbbra is fennáll a kihívás, hogyan lehet még életszerűbbé tenni az emberi arcvonások modellezését, vagy a komplex szerkezeti átalakításokat.

A videó egy gyors áttekintést ad a modell belső működéséről is, rávilágítva az új architektúra erősségeire és lehetőségeire. Felmerül a kérdés, vajon mennyire alkalmazható mindez a mindennapi kreatív, akár professzionális képszerkesztési folyamatokban.