Egy újabb, látványos mérföldkőhöz érkezett a mesterséges intelligencia fejlesztés: az Alibaba által bemutatott Qwen3.5-397B-A17B modellt most közelről ismerhetjük meg. Ez az innovatív, multimodális nyelvi modell nem utólag csatolja a képi információkat, hanem eleve közös tanulással közelíti meg a szöveges és vizuális adatokat, így különösen ígéretesnek tűnik komplex feladatok megoldásában.
A bemutató során a néző betekintést kap a modell építészeti újdonságaiba, például abba a hibrid architektúrába, amely képes gyorsabb feldolgozást és hatékonyabb teljesítményt biztosítani, mint a legtöbb versenytársa. Külön izgalmas, hogy a fejlesztés során a vizuális és nyelvi komponenseket közel 100%-os hatékonysággal dolgozzák fel együtt.
Az epizódban kipróbálnak több kreatív és nyelvi kihívást: egy tolatós puzzle feladvány mellett weboldal készítési utasítást, valamint többnyelvű iratok felismerését és elemzését is tesztelik. Az is előkerül, miként képes a modell a nyelvi azonosításra és részletes adatkinyerésre bonyolultabb, akár vallási tartalmú dokumentumokból is.
A műsorvezető végigkalauzol a helyi telepítés lehetőségein Mac gépen, bemutatva, milyen hardverkövetelményekkel és szoftveres lépésekkel lehet a Qwen3.5-397B-A17B-t otthon is futtatni. Felmerül a kérdés: vajon tényleg lehetséges-e egy-egy nyílt modell ilyen horderejű teljesítményre egy egyszerű asztali gépen?
Érdekességként kitér a modell teljesítményére a különféle benchmarkokon: mikor győzi le riválisait, mikor marad kissé mögöttük, illetve mi teszi igazán figyelemre méltóvá a teljesítmény-költség arányát. Nem hiányoznak a gyakorlati bemutatók sem, amelyek különös hangsúlyt fektetnek a valós világban alkalmazható ügynökszerű képességekre és a multimodalitás előnyeire.






