Az IBM bemutatta új Granite-Docling modelljét, amely a dokumentumok mesterséges intelligenciával támogatott feldolgozására készült. Ez az eszköz CPU-n és GPU-n egyaránt futtatható, így széles körben elérhető a felhasználók számára. A videóban részletesen bemutatják, hogyan lehet helyileg telepíteni, valamint többféle dokumentumon is kipróbálják – köztük komplex PDF-ekkel, táblázatokkal, diagramokkal és képekkel teli anyagokon.
A tesztelés során különböző dokumentumtípusokon futtatják a modellt, hogy feltárják, mennyire képes pontosan kinyerni az információkat, például képaláírásokat és hivatkozásokat. Felmerül a kérdés, hogy az új megoldás kiválthatja-e a hagyományos OCR-módszereket, és miben nyújt többet azoknál.
Technikai szempontból érdekes, hogyan működik együtt a doclinkes architektúra az IBM Granite modellel, illetve mennyire egyszerű a CLI és kódból történő használat. A videóban kiemelten foglalkoznak a VRAM-felhasználással és az erőforrásigénnyel is, bemutatva, hogy akár szerényebb gépeken is hatékonyan tud futni a modell.
További érdekesség, hogy az új modell több nyelv támogatását is kínálja, így arab, japán, kínai és angol dokumentumok feldolgozására is képes. A felvetett kérdés, hogy valóban jelentős előrelépést jelent-e az OCR-technológiákhoz képest, további vizsgálatra, tesztelésre ösztönöz.