A
A
  • Angol
  • Magyar
  • 10 perc

Microsoft Harrier: új, többnyelvű szövegfeldolgozó modell több mint 40 nyelv támogatásával

A Microsoft új Harrier modellje forradalmi megközelítéssel, több változatban, több mint 40 nyelvet támogatva kínál szemantikus szövegfeldolgozást kiemelkedő pontossággal.

Nemrégiben a Microsoft egy új, kiemelkedő jelentőségű fejlesztést mutatott be: a Harrier nevű, többnyelvű szövegbeágyazó modellt, amelyet egy ragadozó madárról neveztek el. Érdekessége, hogy fejlesztésekor dekóder-alapú architektúrát választottak, amely szakít a korábbi, főként csak kódoló típusú modellek hagyományaival. Ez az irányváltás izgalmas mérnöki döntéseket von maga után, amelyek a videóban részletezve is megismerhetők.

A Harrier három méretváltozatban érhető el, eltérő paraméterszámú modellekkel – a legnagyobb 27 milliárd paraméteres, de kisebb, könnyebb és gyorsabb modellekkel is találkozhatunk. Egyik fő koncepciója, hogy bármely szöveget tömör, sűrű vektorrá alakít, ami különböző mesterséges intelligencia feladatok – például szemantikus keresés, szövegosztályozás vagy hasonlóságvizsgálat – kulcsa lehet.

Az új modellt alapos benchmark teszteknek vetették alá az iparági standardnak számító MTAB – Massive Text Embedding Benchmark – rendszerében, ahol az állítások szerint kimagasló eredményeket ért el. A különböző modelleket összehasonlítva láthatók a hatékonyságbeli, méretbeli és pontosságbeli különbségek, így felmerül a kérdés, hogy milyen használati környezetre melyik verzió lehet az ideális választás.

A Harrier beágyazó modell egyik kiemelkedő tulajdonsága a nyelvi sokszínűség: 40-nél is több nyelvet támogat, köztük európai, ázsiai, arab és egyéb régiók nyelveit. Vajon mennyire pontos a modell alacsonyabb erőforrású, ritkább nyelvek esetében? Mennyiben képes fenntartani a szemantikai egyezést a kérdések és dokumentumok között különböző nyelveken?

A bemutató során gyakorlati példákon keresztül látható, hogy milyen egyszerűen lehet telepíteni a modellt Linux rendszeren, kifejezetten nagy GPU memóriát igényelve, valamint hogyan lehet tesztelni a különböző változatokat és mérni a modellek teljesítményét különféle nyelvi minták között. Mindez további kérdéseket is felvet a modellek mérete, használhatósága és alkalmazhatósága kapcsán.