Új kínai kódmodellek tesztelése: CAT-Dev-32B és CAT-Coder bemutató ✦ UMA

Bemutatjuk, mire képes a Kawaii labor két új, kódorientált nagy nyelvi modellje valódi szoftverfejlesztési feladatokon.

A Kawaii nevű kínai kutatólabor ismét új, kódolásra optimalizált nagy nyelvi modelleket mutatott be: a CAT-Dev-32B-t és a CAT-Coder-t. Ezek a modellek főként szoftverfejlesztői feladatok automatizálását és támogatását célozzák, agentikus megerősítéses tanulással képezve a kód intelligenciát.

A videó elsőként azt járja körül, hogyan telepíthető és futtatható helyben a CAT-Dev-32B modell, bemutatva a szükséges hardverigényt is – például egy Nvidia H100 GPU-t. Emellett szó esik a modell szerkezeti és tréningfolyamatairól: több stációs pipeline, eszközhasználat, finomhangolás nyolc programozási területen, valamint megerősítéses tanulás speciális végrehajtásfákkal.

A tesztek során olyan programozási feladatokat hajtanak végre, mint hibajavítás, automatikus patch generálás, illetve komplex alkalmazásprototípusok (például molekulalabor-szimulátor 3D-ben, weben). Érdekes kérdés, hogy mennyire képesek ezek a nagy modellek a valós kódmegoldásokra, hol húzódnak a jelenlegi határok, illetve mit árulnak el a benchmarkingadatok a tényleges használhatóságról.

Végül felmerül az összehasonlítás más ismert kódolási AI-ügynökökkel, például az OpenAI és az Anthropic megoldásaival. Felvetődik, vajon tudnak-e igazi újdonságot hozni ezek az új modellek, vagy inkább csak a meglévő szinthez igazodnak.

Új kínai kódmodellek tesztelése: CAT-Dev-32B és CAT-Coder bemutató

Hasonló tartalmak:

Miért kullog az AMD az Nvidia mögött a játékok felskálázásában 2025-ben?

Oroszország olajválsága: gazdasági kihívások és a háborús költségvetés szorítása

Nvidia ARM chipek, privát kijelzők és AI-botrányok a tech világban

Liquid AI LFM2-24B: Az új nyelvi modell tesztje és elemzése helyben

Anthropic és a Pentagon: etikai kihívások a mesterséges intelligencia katonai alkalmazása körül