Fahad Mirza egy frissen megjelent nagy nyelvi modellt, a Virtuoso Large-72B-t mutatja be részletesen, amely 72 milliárd paraméterrel és a Quen 2.5 architektúrával igyekszik felvenni a versenyt a hasonló méretű modellekkel.
Az installáció folyamata során változatos technikai megoldások, formátumok, kvantálási szintek, valamint a hardverigények is szóba kerülnek: például az Nvidia H100 GPU egyedülálló teljesítménye és az alkalmazott szoftveres felület, a Text Generation Web UI használata.
Különböző gyakorlati példákon keresztül vizsgálják meg a modell képességeit; ezek között szerepel összetett beosztáskészítés, elméleti gondolkodás (Theory of Mind), kreatív szövegírás több nyelven, komplex útiterv összeállítás, valamint a kulturális különbségek és a szlengek értelmezése.
Szó esik etikai, személyiségbeli és gyakorlati kihívásokról is, például, miként kezeli a modell a túlzó vagy provokatív kéréseket, illetve mennyire képes többnyelvű fordításra és kulturális érzékenységre.