A
A
  • Angol
  • Magyar
  • 8 perc

Új szintre emeli a szenzitív adatok védelmét az Nvidia GLiNER-PII modellje

Új megközelítést mutat be az Nvidia: fejlett modell segítségével automatizáltan ismerhetők fel és osztályozhatók a kényes adatok különféle szövegekben.

Az Nvidia új GLiNER-PII modellje kifejezetten arra készült, hogy felismerje és osztályozza a személyazonosításra alkalmas (PII) és védett egészségügyi (PHI) adatokat különböző típusú szövegekben. Érdekesség, hogy ez a modell egy innovatív, transzformer-alapú architektúrára épül, amelyben nemcsak a szöveget, hanem a keresett entitások címkéit is beágyazzák.

Az anyag betekintést nyújt abba, hogyan használható helyben, GPU-s környezetben ez a mesterséges intelligencia, illetve bemutat egy valódi példát is, ahol a rendszer különböző „label” beállításokat alkalmaz. Felmerül a kérdés: mennyire pontosan képesek az ilyen modellek felismerni, majd kiemelni a kényes információkat strukturált és szabad szövegekben?

Részletesen szó esik a modell felhasználási lehetőségeiről a jogi, egészségügyi, pénzügyi szektorban, és azt is érinti, hogyan segítheti a szabályozásoknak (pl. GDPR, HIPPA, CCPA) való megfelelést. Izgalmas technikai részletek hangzanak el a hálózat címke-vezérelt működéséről és a „threshold” paraméter finomhangolásáról, amely markánsan befolyásolja a találatok mennyiségét és minőségét.

A bemutató alapján azt is megismerhetjük, miként illeszthető be egy ilyen modell például egy automatizált feldolgozási vagy audit munkafolyamatba, illetve mik a fő szempontjai a testreszabásnak és finomhangolásnak a valós használat során.