Az Alibaba legújabb mesterséges intelligencia modellcsaládja, a Qwen 3, jelentős újításokat hoz a nyílt forráskódú nyelvi modellek világába. A bemutatóban részletesen áttekintik a különböző, akár 235 milliárd paraméteres modellek tulajdonságait, valamint a kisebb, de kiemelkedő teljesítményt nyújtó verziókat is.
Az ismertető kiemeli, hogy a Qwen 3 modellek különösen jól teljesítenek programozási feladatokban, sok esetben túlszárnyalják a versenytársakat, például a Gemini vagy Llama újabb változatait. Érdekes összehasonlításokat láthatunk, például arról, hogy mennyivel gazdaságosabban és gyorsabban futtathatók egyes Qwen modellek, mint más, akár nagyobb méretű rendszerek.
Szó esik a modellek innovatív, hibrid gondolkodási módjáról, amelynek köszönhetően mind lépésről lépésre haladó, mélyebb megközelítések, mind gyors válaszadás lehetséges. Kitérnek az óriási, több mint 119 nyelv kezelését biztosító támogatásra, illetve a fejlett kontextushosszúságra, amely akár 128 000 tokent is elérhet.
A fejlesztés során felhasznált adatmennyiség és specifikus trükkök – például a régebbi Qwen modellek alkalmazása szövegkinyeréshez vagy szintetikus adatok előállítása – szintén bemutatásra kerülnek. Ezen felül az is terítékre kerül, hogy jelenleg kizárólag szöveges bemenettel rendelkező rendszerekről van szó, multimodális képességek nélkül.
A megszólaló áttekinti az elérhető próbalehetőségeket és platformokat, amelyek segítségével akár saját gépen is könnyedén kipróbálhatók ezek a modellek, például a HuggingFace vagy Olama használatával. Felvetődik a kérdés: vajon ezek a fejlesztések mennyiben alakítják át az AI nyílt forráskódú világát, és hogyan reagálnak rá az olyan ismert riválisok, mint az Anthropic, az OpenAI vagy a Google Gemini?