A
A
  • Angol
  • Magyar
  • 10 perc

HunyuanImage 3.0: A Tencent forradalmi képszerkesztő AI-ja és a licencpolitika miatti vita

A Tencent új képszerkesztő AI-ja, a HunyuanImage 3.0, forradalmi szerkesztési módszereket hoz, de vitatott licencpolitikájával megosztja a közösséget.

Az utóbbi években a mesterséges intelligenciával támogatott képgenerálás és -szerkesztés hatalmas fejlődésen ment keresztül, különösen a kínai fejlesztőknek köszönhetően, akik gyakran engedékeny licencekkel járulnak hozzá a globális innovációhoz. Most azonban a Tencent új, HunyuanImage 3.0 rendszere – szigorúbb, régiókat kizáró licencpolitika mellett – egészen eltérő megközelítést alkalmaz, amely már a közösségi visszhangban is érezhető vitát keltett.

Az új, mintegy 80 milliárd paraméteres modell bevezet egy egyedi ‘chain of thought’ logikát, amely szerkesztés előtt mérlegeli és elemzi a felhasználói utasításokat és az input képeket. Bemutatásra kerül, hogyan lehet többlépcsős módosításokat végezni: például egy üres szobát részletgazdagon berendezni vagy termékfotókat teljesen új kompozícióba helyezni.

A példákban szó esik arról, miként tudja a rendszer az emberi alakot komplex pózba áthelyezni, ugyanakkor arcvonásokat és ruházati részleteket természetes módon megtartani. Speciális kihívások, mint a háttér teljes cseréje, perspektivikus tárgycsere vagy élethű fény- és árnyékviszonyok létrehozása szintén hangsúlyt kapnak.

A videó végigkíséri a tesztelés folyamatát, kitér az erősségekre – például a természetes szerkesztési lépésekre vagy az egységes végső kompozíciókra –, és felszínre hoz olyan kérdéseket, mint a zárt licencből adódó hozzáférési korlátok, valamint a lokális használat hiányából fakadó problémák.