Zyra, a San Franciscó-i mesterséges intelligencia laboratórium, hosszabb hallgatás után mutatja be legújabb, nyílt forráskódú nyelvi modelljét: a Zia 8 milliárd paraméteres verzióját. A fejlesztés egyik különlegessége, hogy teljes egészében AMD hardveren képezték ki, ami példa nélkülinek számít ezen a teljesítmény szinten.
A modell egyik fő ambíciója, hogy maximális intelligenciát sűrítsen minimális aktív paraméterbe – mindössze 760 millió aktív paraméter dolgozik a 8,4 milliárd összesből. Az eredmények figyelemre méltóak: a Zia 8B több nagy volumenű és némely nyílt forráskódú modellt is maga mögé utasít bizonyos benchmarkokon, és olyan márkás modellekkel is versenyképes, mint a Claude vagy a Gemini.
A videó részletesen elemzi a Zia architektúráját, különleges, 16 szakértői modult tartalmazó blokkjait, valamint a Marovian RSA névre keresztelt fejlesztést, amely a komplex matematikai problémák esetében növeli meg jelentősen a teljesítményt. Felszínre kerülnek az aktív és teljes paraméterszám közötti különbségek, valamint az is, hogyan osztja le a modell a különböző feladatokat az egyes specialisták között.
Gyakorlati példák mutatják be a modell logikai és számítási képességeit: a néző lépésről lépésre kísérheti végig egy több lépéses vészhelyzeti pilótafeladat matematikai megoldását, majd egy programozási kihíváson keresztül tesztelhetjük a modell rendszertervező és kódíró képességeit. A kérdés, hogy mennyire megbízható és precíz ezekben az összetett, valós szituációkban, és hogy hogyan viszonyul a többi népszerű modellhez.










