A
A
  • Angol
  • Magyar
  • 14 perc

Új kínai kódmodellek tesztelése: CAT-Dev-32B és CAT-Coder bemutató

Bemutatjuk, mire képes a Kawaii labor két új, kódorientált nagy nyelvi modellje valódi szoftverfejlesztési feladatokon.

A Kawaii nevű kínai kutatólabor ismét új, kódolásra optimalizált nagy nyelvi modelleket mutatott be: a CAT-Dev-32B-t és a CAT-Coder-t. Ezek a modellek főként szoftverfejlesztői feladatok automatizálását és támogatását célozzák, agentikus megerősítéses tanulással képezve a kód intelligenciát.

A videó elsőként azt járja körül, hogyan telepíthető és futtatható helyben a CAT-Dev-32B modell, bemutatva a szükséges hardverigényt is – például egy Nvidia H100 GPU-t. Emellett szó esik a modell szerkezeti és tréningfolyamatairól: több stációs pipeline, eszközhasználat, finomhangolás nyolc programozási területen, valamint megerősítéses tanulás speciális végrehajtásfákkal.

A tesztek során olyan programozási feladatokat hajtanak végre, mint hibajavítás, automatikus patch generálás, illetve komplex alkalmazásprototípusok (például molekulalabor-szimulátor 3D-ben, weben). Érdekes kérdés, hogy mennyire képesek ezek a nagy modellek a valós kódmegoldásokra, hol húzódnak a jelenlegi határok, illetve mit árulnak el a benchmarkingadatok a tényleges használhatóságról.

Végül felmerül az összehasonlítás más ismert kódolási AI-ügynökökkel, például az OpenAI és az Anthropic megoldásaival. Felvetődik, vajon tudnak-e igazi újdonságot hozni ezek az új modellek, vagy inkább csak a meglévő szinthez igazodnak.