A
A
  • Angol
  • Magyar
  • 11 perc

Nvidia Qwen3.6 35B modell: Kvantálás és optimalizáció a legújabb GPU-kkal

Bemutatjuk az Nvidia által kvantált Qwen3.6 35B modellt, annak technikai hátterét, előnyeit, illetve azt, hogy milyen feladatokra és hardverre optimalizált.

Egyre fejlettebb mesterséges intelligencia modellekkel találkozunk, de ezek futtatásához gyakran speciális hardver szükséges. A felvétel során egy különlegesen optimalizált, kvantált Qwen3.6 35B modellt mutatnak be, amelyet az Nvidia saját eszközeivel, szigorú pontossági tesztekkel fejlesztett.

Az új NVFP4 kvantizációs eljárás és a hozzá szükséges Hopper, illetve Blackwell GPU architektúrák szerepe hangsúlyos témaként jelenik meg. Felmerülnek olyan kérdések, mint hogy miért pont ez a hardver szükséges az új kvantizációhoz, miben tér el ez a megoldás a többi gyártó (Red Hat AI, Unsloth) által kínált verzióktól, és mit takar az úgynevezett mikroblokk skálázás.

Gyakorlati demonstrációként letöltik a modellt, és bemutatják, miként működik együtt vLLM-en keresztül egy H100 Hopper GPU-n. Tesztelik extrém feladatokon, például komplett animált HTML canvas alkalmazás generálásával, illetve többnyelvű szövegfordítással, így a videó nemcsak technikai, hanem kreatív oldalról is rávilágít a legújabb AI-modellek képességeire.

A különböző kvantált modellek lehetőségeit és eltéréseit is áttekintik: mennyire fontos a hardver-kompatibilitás, mikor érdemes melyik kvantizációt használni, és milyen szempontok alapján érdemes választani a különböző verziók között.