A mesterséges intelligencia (AI) üzleti értékének kiaknázására egyre gyakrabban alkalmazzák a Retrieval-Augmented Generation (RAG) módszertant, amely lehetővé teszi, hogy a vállalati adatokat innovatívan integráljuk a nyelvi modellek működésébe. Sok vállalat számára a modellek újratanítása, finomhangolása túl költséges vagy nem megvalósítható, ezért a RAG-alapú megoldások jelentik a legjobb utat saját adatvagyonuk hasznosítására.
A bemutatott RAG-Anything eszköz egy all-in-one, multimodális keretrendszer, amely képes kezelni modern dokumentumtípusokat: szövegeket, képeket, táblázatokat, egyenleteket és diagramokat. A rendszer a lighter rag projektre épül, villámgyors keresési folyamatot és webes felületet kínál, továbbá képes egyszerre többféle adatmodalitás feldolgozására és lekérdezésére.
A fejlett VLM lekérdezési mód segítségével az eszköz a dokumentumokban lévő szöveg és vizuális elemek alapján együttesen tud válaszokat generálni, amikor például ábrák vagy szkennelt oldalak szerepelnek a forrásban. A projektben fontos helyet kap a MinIOU dokumentumfeldolgozó, amely a PDF-ek részletes feltárását végzi.
A telepítés során bemutatták az installációs lépéseket, tippeket adtak a környezet előkészítéséhez, és kitértek az API-k (például OpenAI) kulcsainak használatára, valamint a költségek és a throttling kérdéskörére. Az eszköz képes üzleti jelentéseken futtatott, precíz és referenciákkal alátámasztott válaszokat adni, de bemutatásra kerül egy technikai adatlap feldolgozása is (például GPU specifikációk lekérdezése, elemzése).
Külön figyelmet kap a multimodális feldolgozás (képek, táblázatok, szabad szöveg, műszaki adatok egyaránt értelmezhetők), valamint az entitások, összefüggések feltárásán alapuló, gráfalapú keresés lehetősége. A videó során szó esik a költségekről is, valamint arról, hogy a felhőalapú API-k mellett milyen jövőbeli igény lehet a lokális modellek támogatására.









