Két mesterséges intelligenciát, a GLM 5.2-t és az Anthropic Claude Opus 4.8-at mérik össze ebben a videóban, hogy kiderüljön, melyikük teljesít jobban különféle valós programozási és hibakereső feladatokon. Az egyik modell teljesen nyílt forráskódú és szabadon futtatható, míg a másik egy zárt és fizetős rendszer, eltérő filozófiák mentén dolgoznak. Különösen érdekes látni, hogyan viszonyulnak ugyanahhoz a feladathoz, mint például komplex képfeldolgozás, HTML-generálás, precíz mérnöki vizualizáció és valós idejű adatok kezelése.
A tesztek során valós problémák elé állítják az AI-kat, például hibákat kell megtalálniuk és javítaniuk egy teljes szoftverprojektben, illetve optimalizálniuk egy nehéz SQL-lekérdezést. Figyelemre méltó, hogy a modellek módszertani különbségeket is mutatnak: más-más mechanizmusokat alkalmaznak, és eltérően viszonyulnak a kódkommentekhez és hibaleírásokhoz is.
Különféle megközelítésekkel, váratlan buktatókkal és okos trükkökkel zárul minden kör, ahol az egyik vagy másik rendszer néha szokatlan, akár extra lépéseket is tesz – vagy éppen előnyt szerez racionalitásával és mélyebb elemzésével. A nézőt arra is készteti a videó, hogy elgondolkodjon: mitől lesz hatékony egy modern AI-kódoló, és mely tulajdonságok tehetik igazán értékessé az ilyen eszközöket valós fejlesztői környezetben?









