Észak-Németország partjainál található Mellum szigetének dinamikus, folyamatosan változó természete inspirálta a JetBrains legújabb fejlesztésének nevét. A Mellum 2 egy modern, 12 milliárd paraméteres kódgeneráló modell, amelyet teljesen a nulláról építettek fel, hogy hatékonyan tudjon összetett, többlépéses feladatokat végrehajtani és külső eszközöket is használni.
A videó bemutatja, hogyan lehet a Mellum 2 modellt helyben, vLLM segítségével telepíteni és kiszolgálni egy nagy memóriájú NVIDIA RTX A6000 GPU-n. A demonstráció során kiemelik a modell gyorsaságát és skálázhatóságát, annak különleges, kombinált figyelmi architektúrája révén.
Izgalmas kérdések merülnek fel a helyi eszközhasználat kapcsán: hogyan oldható meg, hogy a modell ne csupán válaszoljon, hanem valódi műveleteket végezzen a fájlrendszeren keresztül? A néző megismerheti az MCP protokoll működését, és a helyi szövegelőállítástól a konkrét fájlműveletekig terjedő képességeket.
Külön figyelmet kap a Hermes agent, amely összetett kódgenerálási feladatokat is képes tesztelni, hogy kiderüljön, miként birkózik meg a modell valós, egymásba ágyazott problémákkal. A hangsúly az újszerűségen és a teljes mértékben szabad licencen van, amely mindenki számára lehetővé teszi a kipróbálást és továbbfejlesztést.









