Két év telt el azóta, hogy a Gina AI előállt első embedding modelljével, amely rövid idő alatt a nagyobb laborok vetélytársává vált. Új fejlesztésükkel, az ötödik verzióval a figyelem középpontjába kerültek, főként azért, mert a modell kiemelkedő teljesítményt nyújt – annak ellenére, hogy szerény hardverigénye van, és akár helyileg, GPU nélkül is futtatható.
Az új embedding modell egyedülálló megoldást kínál: képes 57 nyelven értelmezni a szövegeket, és egyetlen vektorba sűríteni akár teljes dokumentumok jelentését. Bemutatásra kerül, hogy miként lehet ezt a modellt telepíteni, futtatni, illetve hogyan lehet különböző nyelveken értékelt dokumentumokat összehasonlítani, amely során olyan érdekes kérdések is felmerülnek, mint hogy mennyire relevánsan rangsorolja a válaszokat vagy hogy milyen eltérések tapasztalhatók egyes nyelvek között.
Részletesen ismertetésre kerül a modell háttérarchitektúrája is, többek között hogyan képes hosszabb szövegrészeket kezelni, valamint milyen szempontokat érdemes figyelembe venni a többnyelvűség tesztelésekor. Az is felszínre kerül, mely nyelvek esetében bizonyul erősebbnek, illetve hol akadnak még kihívások a kevesebb erőforrású, ritkább nyelvek kezelésénél.








