Az oktatóvideó megmutatja, hogyan használható a MongoDB vektortárolóként RAG (retrieval augmented generation) folyamatok számára. Bemutatásra kerül, miként kapcsolható össze a MongoDB egy Jupyter notebookban, amely a Google Colab platformon fut, lehetővé téve a nézők számára a lépések követését teljesen ingyenes eszközökkel.
A magyarázat során kitérnek arra, pontosan mi a MongoDB, és hogyan különbözik a NoSQL adatbázis az RDBMS típusoktól. Kiemelik a dokumentum-orientált, rugalmas sémájú adattárolási megoldásait, valamint a MongoDB Atlas nevű felhőalapú, menedzselt szolgáltatást és annak beüzemelését. Szóba kerül az is, hogyan lehet mintadatokat betölteni és előkészíteni a Movie adatbázissal, kihangsúlyozva az adat-előkészítés szükségességét a vektoros keresésekhez.
Az anyag részleteiben bemutatja a RAG folyamatát, és hogy miért hasznos a kontextus-alapú kereséshez a vektortároló, különösen, ha nagy nyelvi modellekkel, például a DeepSeek R1 Distilled Coin modellel dolgozunk. Feltárják, miként transzformálhatók a szöveg-adatok embeddinggé Sentence Transformers modellel, majd ezek tárolása és indexelése zajlik a MongoDB-ben.
Központi kérdés, milyen előnyöket nyújt, ha saját adatokkal egészítjük ki a nyelvi modellek tudását retrieval augmented generation során, és hogyan tudnak ezek a rendszerek pontos, kontextuális választ adni egyedi felhasználói lekérdezésekre. Felmerül, miként lehet gyors kereséseket végezni a vektortárolóban, illetve hogyan kombinálható a saját és publikus tudás az LLM-mel való válaszadásban.