A Kawaii nevű kínai kutatólabor ismét új, kódolásra optimalizált nagy nyelvi modelleket mutatott be: a CAT-Dev-32B-t és a CAT-Coder-t. Ezek a modellek főként szoftverfejlesztői feladatok automatizálását és támogatását célozzák, agentikus megerősítéses tanulással képezve a kód intelligenciát.
A videó elsőként azt járja körül, hogyan telepíthető és futtatható helyben a CAT-Dev-32B modell, bemutatva a szükséges hardverigényt is – például egy Nvidia H100 GPU-t. Emellett szó esik a modell szerkezeti és tréningfolyamatairól: több stációs pipeline, eszközhasználat, finomhangolás nyolc programozási területen, valamint megerősítéses tanulás speciális végrehajtásfákkal.
A tesztek során olyan programozási feladatokat hajtanak végre, mint hibajavítás, automatikus patch generálás, illetve komplex alkalmazásprototípusok (például molekulalabor-szimulátor 3D-ben, weben). Érdekes kérdés, hogy mennyire képesek ezek a nagy modellek a valós kódmegoldásokra, hol húzódnak a jelenlegi határok, illetve mit árulnak el a benchmarkingadatok a tényleges használhatóságról.
Végül felmerül az összehasonlítás más ismert kódolási AI-ügynökökkel, például az OpenAI és az Anthropic megoldásaival. Felvetődik, vajon tudnak-e igazi újdonságot hozni ezek az új modellek, vagy inkább csak a meglévő szinthez igazodnak.