Az Nvidia új, nyílt forráskódú AI modellje lenyűgöző méreteivel és fejlesztéseivel hívja fel magára a figyelmet. Az 550 milliárd paraméteres rendszer mögött speciális architektúra, úgymint szakértői modulok keveréke áll, amely lehetővé teszi, hogy a modell mindig a legmegfelelőbb részét használja az aktuális feladathoz.
A videóban a Hermes ügynök önálló célkitűzésének és végrehajtásának vizsgálatába nyerhetünk betekintést: hogyan képes a rendszer egy FastAPI alkalmazás optimalizálására, benchmarkolására és az eredmények értékelésére teljesen autonóm módon. Az ügynöki ciklusok során a felhasználónak elég egy célt megadni, a rendszer pedig egymás után hajt végre lépéseket a cél eléréséig.
Részletes leírást kapunk arról, miként épül fel a Neotron 3 Ultra, hogyan kombinálja az Mamba blokkokat, a figyelmi rétegeket és a szakértői rétegeket, valamint milyen módszerekkel ér el jobb teljesítményt hosszú kontextusok kezelésében. A tanítás során több tanítómodellt alkalmaztak, amelyek egy-egy speciális területen szakértők, így a végeredményben a modell széles körű feladatokat képes magas színvonalon ellátni.
A videó érinti az autonóm döntéshozatal, okfejtés és többnyelvűség kérdését is: stresszteszt alatt a modell összetett, több kontinensen átívelő túlélési szimuláció kapcsán mutatja meg, miként boldogul extrém követelmények, korlátok és eltérő nyelvek között.









