A
A

Csak YouTube-on nézhető meg

  • Angol
  • Magyar
  • 8 perc

Új szintre lép a szemantikus keresés Pythonban az Alibaba megoldásával

Könnyen telepíthető, szerver nélkül működő, magyarul is kipróbálható vektoradatbázissal ismerkedhetsz meg ebben a bemutatóban, amely szemantikus szövegkeresést tesz lehetővé lokális gépen.

Ebben a videóban egy új, villámgyors és könnyen használható vektortárról esik szó, amelyet az Alibaba fejlesztett ki, és most nyílt forráskódúként érhető el mindenkinek. Az ismertető különlegessége, hogy a megoldás teljesen telepítésmentes, nem igényel szervereket vagy bonyolult konfigurációt, csupán egy Python-folyamatban futtatható, és a lokális gépen tárol minden adatot.

A bemutató során kiderül, milyen módon támogatja a szoftver a hibrid keresést, összekapcsolva a strukturált szűrőket és a szemantikus keresést vektoros technológiákkal. Megtudhatjuk, hogyan alakítja át a szövegeket számokká, majd ezek alapján keres jelentéstani egyezéseket. A néző betekintést kap abba is, hogyan készíthet saját példát és indíthatja el az első kereséseit.

Felvetődik a kérdés, hogy a hagyományos RDBMS-alapú rendszerekhez képest milyen előnyt biztosít ez az újfajta adattárolási koncepció vállalati vagy egyéni projektekben. Szóba kerül az is, hogy miként tárolhatunk és indexelhetünk összetett PDF fájlokat, és hogyan találhatjuk meg a legrelevánsabb szövegrészeket akár nagyobb dokumentumokban is, pusztán jelentés alapján, kulcsszavak nélkül.

A videó gyakorlati példán keresztül vezeti végig a nézőt a folyamaton, röviden kitérve a háttérben dolgozó HNSW indexelési eljárásra is, amely jelentősen felgyorsítja a szemantikus keresést. Továbbá érdekességekre, további lehetőségekre és a bővíthetőségre is felhívja a figyelmet a készítő, bátorítva a közösséget a kód kipróbálására.