Egyre fejlettebb mesterséges intelligencia modellekkel találkozunk, de ezek futtatásához gyakran speciális hardver szükséges. A felvétel során egy különlegesen optimalizált, kvantált Qwen3.6 35B modellt mutatnak be, amelyet az Nvidia saját eszközeivel, szigorú pontossági tesztekkel fejlesztett.
Az új NVFP4 kvantizációs eljárás és a hozzá szükséges Hopper, illetve Blackwell GPU architektúrák szerepe hangsúlyos témaként jelenik meg. Felmerülnek olyan kérdések, mint hogy miért pont ez a hardver szükséges az új kvantizációhoz, miben tér el ez a megoldás a többi gyártó (Red Hat AI, Unsloth) által kínált verzióktól, és mit takar az úgynevezett mikroblokk skálázás.
Gyakorlati demonstrációként letöltik a modellt, és bemutatják, miként működik együtt vLLM-en keresztül egy H100 Hopper GPU-n. Tesztelik extrém feladatokon, például komplett animált HTML canvas alkalmazás generálásával, illetve többnyelvű szövegfordítással, így a videó nemcsak technikai, hanem kreatív oldalról is rávilágít a legújabb AI-modellek képességeire.
A különböző kvantált modellek lehetőségeit és eltéréseit is áttekintik: mennyire fontos a hardver-kompatibilitás, mikor érdemes melyik kvantizációt használni, és milyen szempontok alapján érdemes választani a különböző verziók között.









