A
A
  • Angol
  • Magyar
  • 11 perc

JetBrains Mellum 2: Helyben futtatható kódgenerálás és eszközhasználat bemutatója

A JetBrains új, helyben futtatható Mellum 2 kódgeneráló modelljét tesztelik vLLM és MCP segítségével, valós eszközök és agentek bevonásával.

Észak-Németország partjainál található Mellum szigetének dinamikus, folyamatosan változó természete inspirálta a JetBrains legújabb fejlesztésének nevét. A Mellum 2 egy modern, 12 milliárd paraméteres kódgeneráló modell, amelyet teljesen a nulláról építettek fel, hogy hatékonyan tudjon összetett, többlépéses feladatokat végrehajtani és külső eszközöket is használni.

A videó bemutatja, hogyan lehet a Mellum 2 modellt helyben, vLLM segítségével telepíteni és kiszolgálni egy nagy memóriájú NVIDIA RTX A6000 GPU-n. A demonstráció során kiemelik a modell gyorsaságát és skálázhatóságát, annak különleges, kombinált figyelmi architektúrája révén.

Izgalmas kérdések merülnek fel a helyi eszközhasználat kapcsán: hogyan oldható meg, hogy a modell ne csupán válaszoljon, hanem valódi műveleteket végezzen a fájlrendszeren keresztül? A néző megismerheti az MCP protokoll működését, és a helyi szövegelőállítástól a konkrét fájlműveletekig terjedő képességeket.

Külön figyelmet kap a Hermes agent, amely összetett kódgenerálási feladatokat is képes tesztelni, hogy kiderüljön, miként birkózik meg a modell valós, egymásba ágyazott problémákkal. A hangsúly az újszerűségen és a teljes mértékben szabad licencen van, amely mindenki számára lehetővé teszi a kipróbálást és továbbfejlesztést.