Két Kína által fejlesztett, erős nyílt nagy nyelvi modell, a Kimi K2.7 és a GLM-5.2 mérkőzik meg egy valós programozási feladatban Ubuntu rendszeren. A videó elején röviden bemutatják mindkét modell technikai hátterét, kiemelve az eltérő paramétereket, kontextus-ablakokat és a nyílt forráskódú elérhetőséget.
A demonstráció során egy fiktív, de komplex világbajnokság-nyomkövető webalkalmazás hibáját kell megtalálniuk és javítaniuk, miközben új funkciókat is létre kell hozniuk. A hiba speciális szabályokra utal: a kvalifikációs sorrendben a pontazonosság melletti gólkülönbséget nem veszi figyelembe az alkalmazás, így az algoritmus fejlesztése mindkét modell számára kihívást jelent.
Ezt követően egy kreatív kódgenerálási feladatot is teljesíteniük kell: egy önálló HTML-fájlban kell animált szimulációt készíteni a szibériai szél útjáról, amely Oroszországtól Pakisztánig halad. A vizsgálat során figyelemreméltó különbségek és egyéni erősségek derülnek ki a modellek outputjában a kreativitás, hibakezelés és funkciók tekintetében.
A videó további érdekessége, hogy mindkét modell teljesítményét részletesen bemutatja valós példákkal, eszközhasználattal, időzítésekkel és fejlesztői munkafolyamatokon keresztül. Az epizód elgondolkodtat a mesterséges intelligencia aktuális fejlettségéről, a jelenlegi nyílt forráskódú modellek képességeiről, és arra ösztönöz, hogy a felhasználók saját igényeik szerint is próbálják ki ezeket az eszközöket.










