Ebben az útmutatóban lépésről lépésre végigkövethető, miként telepíthető és integrálható a Google Gemma 4 E2B modell, a Hermes agent és a vLLM, hogy egy teljes multimodális MI rendszert hozzunk létre kizárólag helyi eszközökön, ingyenesen.
A folyamat során bemutatásra kerül, hogyan futtatható a modellek telepítése és frissítése, hogyan kezelhető a GPU memóriaterhelés, valamint miként konfigurálhatók különböző végpontok és beállítások.
Érdekes kérdéseket vet fel a multimodális képességek, azaz a szöveg-, hang- és képfeldolgozás helyi futtatásának lehetőségei. A bemutató több példán keresztül tárja fel, hogyan vizsgálható a modell teljesítménye különféle nyelveken, illetve miként tud képekről információkat kinyerni és összefoglalókat készíteni.
Felmerülnek technikai részletek a Hermes agent használatával kapcsolatban, illetve szóba kerül, milyen lehetőségeket rejt egy ilyen MI-ökoszisztéma önálló működtetése egyetlen GPU-n.










