Az Alibaba csapata folyamatosan új, erőteljes nyílt forráskódú nyelvi modelleket dob piacra, amelyek között legújabban a Qwen3-30B-A3B-Instruct-2507 is megjelent. A videó lépésről lépésre bemutatja, hogyan kell ezt a modellt helyileg telepíteni, ehhez Ubuntu operációs rendszer és egy Nvidia H100 GPU áll rendelkezésre.
Bemutatásra kerülnek a modell főbb technikai paraméterei: például a 30 milliárd feletti paraméterszám, a ‘mixture of experts’ architektúra, a ‘grouped query attention’ technika vagy a rendkívül hosszú, több mint 260 ezer tokenes kontextuskezelés. A telepítés során szó esik különböző technikai beállításokról és lehetséges memóriahibákról is.
A videó számos tesztet bemutat: többek között azt vizsgálja, hogyan birkózik meg a modell kronologikus események feldolgozásával, idegen nyelvű hibajegyzékek fordításával, valamint bonyolult rendszerelemzési feladatokkal. Külön érdekesség, hogy a rendszer képes egységesen feldolgozni, rendezni és akár tabuláris formában megjeleníteni a különböző forrásból származó adatokat.
Szintén kiemelt figyelmet kapnak a komplex mérnöki-matematikai kihívások, például egy elméleti zöld hidrogén termeléssel és mélytengeri tárolással kapcsolatos szimuláció teljes megoldása. Megvizsgálják a kódgenerálási képességet is, például egy animált rakéta HTML-példán keresztül.
A modell soknyelvűségében rejlő lehetőségekre is kitérnek, valamint etikai és felhasználásbiztonsági kérdések is előkerülnek, például amikor a rendszer provokatív vagy személyes kérésre reagál. Így felmerül, milyen mértékben képes felismerni és kezelni érzékeny vagy nemkívánatos tartalmakat.