A
A
  • Angol
  • Magyar
  • 10 perc

Kicsi, de okos: a Nanbeige 3B nyelvi modell tehetségei és kihívásai

Egy új, hárommilliárd paraméteres nyelvi modell kihívja a nagy szereplőket, és meglepően összetett gondolkodást mutat különféle teszthelyzetekben.

Az összefoglaló betekintést nyújt egy új, kínai fejlesztésű nyílt forráskódú nyelvi modell, a Nanbeige 4.1, azon belül is a 3B variáns működésébe és képességeibe. A készítő az Ubuntu operációs rendszeren, Nvidia RTX 6000 GPU-val telepíti és vizsgálja ezt a különleges, kis méretű, hárommilliárd paraméteres modellt.

Részletesen bemutatásra kerül, hogyan lehet helyileg, saját számítógépen futtatni a modellt, és milyen szoftveres előfeltételek szükségesek ehhez. Megismerjük, hogyan teljesít a Nanbeige 3B más, lényegesen nagyobb modellekhez képest különböző benchmark feladatokon, illetve azt is, miben különbözik ez a kisebb modell a szokásos mezőnytől.

Kiemelt figyelmet kapnak a modell gondolkodási és érvelési képességei; többféle feladat, például logikai rejtvények, programozási kihívások és szöveges problémamegoldás során hasonlítják össze teljesítményét nagyobb, híresebb modellekkel. A videó során szó esik az általa generált kód minőségéről és az üzemeltetés hardverigényeiről is.

Felmerülnek olyan kérdések is, mint hogy vajon képes-e egy ekkora, könnyű modell valódi, többlépéses gondolkodásra, illetve hogyan építi fel válaszait összetett, emberi instrukciók alapján. Továbbá az is bemutatásra kerül, hogy a modell hogyan kezeli a speciális, többlépéses logikai buktatókat, például egy feltételes útvonal- vagy döntési feladatban.