A
A
  • Angol
  • Magyar
  • 13 perc

GPT-OSS-120B modell telepítése és tesztelése egyetlen GPU-val

Nagy teljesítményű OpenAI nyelvi modellt próbálnak ki helyi gépen, egyetlen GPU-val, miközben a gyakorlati használat és tesztelés részleteibe is betekintést nyerünk.

Az OpenAI új, szabadon elérhető 120 milliárd paraméteres GPT-OSS-120B modelljét mutatja be ez a videó, amelyben annak helyi telepítését és részletes tesztelését is megismerhetjük. A telepítési folyamatot Ubuntu rendszeren, egyetlen Nvidia H100 GPU-n mutatják be lépésről lépésre, külön figyelmet szentelve a szükséges tárhely- és VRAM-igénynek, valamint a VLLM és UV csomagkezelő használatának.

Témaként felmerül, hogy a modell párhuzamosan igazodik a nagy teljesítményű és hatékony architektúrához, amelynek köszönhetően csak egy aktív paraméterszett kerül felhasználásra egy token esetén. Az Apache 2 licenc miatt a finomhangolás és egyéni fejlesztés lehetősége is adott. Szó esik továbbá az Agent nevű, testreszabható AI munkaerő alkalmazásról is, amely támogatja a videót.

A tesztelési szakaszban különböző feladatok – például interaktív HTML kódgenerálás, életvezetési tanácsadás, matematikai problémamegoldás és többnyelvű fordítás – mutatják be a modell képességeit. Vizsgálatra kerül az is, hogy mennyire követi pontosan az utasításokat, mennyire koherensek a válaszok, illetve hogy miként kezeli az érzékenyebb, határeset kérdéseket. A bemutató során a hatékonyság, a válaszok logikai felépítése és részletessége, valamint a nyelvi sokszínűség kerül kiemelésre.

Felvetődik a kérdés, milyen új lehetőségeket teremt egy szabadon felhasználható, ilyen méretű nyelvi modell széleskörű hozzáférhetősége, és hogyan használható fel különféle gyakorlati vagy fejlesztési környezetekben.