Két jelentős nyílt forráskódú nyelvi modell, a Gemma4 12B és a Qwen3.6 27B fej-fej melletti összehasonlításán keresztül betekintést kapunk a legújabb multimodális MI-képességekbe. Egyazon hardveres környezetben, ugyanazon GPU-n tesztelik őket, így valós teljesítménybeli eltérések figyelhetők meg.
A videó első szegmensében a kódban való jártasságukat vizsgálják: egy összetett, felhasználói felület alapú HTML-UI megalkotása kihívásként szolgál, mely során a megoldások esztétikai, szerkezeti és funkcionalitásbeli különbségeit is feltárják.
A következő teszt a többnyelvűségre fókuszál: a közismert „A thing of beauty is a joy forever.” mondat lefordítása több mint 80 nyelvre ad lehetőséget arra, hogy a fordítási minőséget, valamint a különféle nyelvi sajátosságokat összevessék. Kiemelt figyelmet kapnak bizonyos nyelvek (japán, arab, izlandi) sajátosságai és a fordítás idiomatikussága.
Végül egy történelmi, kézírásos spanyol dokumentum képe szolgál kiindulópontként a vizuális értelmezés és nyelvazonosítás teszteléséhez. Itt nehézséget jelent magának a kézírásos szövegnek a felismerése és olvashatósága – érdekes kérdéseket vetve fel a gépi értelmezés határairól. A teszt során kiderül, hogyan reagálnak a modellek, amikor nem tudnak biztos megoldást adni.
A felvétel közben szó esik a modellek eltérő architekturális megközelítéseiről – az egyik a paramétermennyiségre, a másik az egységes kódolóra támaszkodik –, illetve annak dilemmájáról, hogy mennyiben mérvadó egy nagyobb paraméterszám az eredmények értelmezésekor. A nézőket is bevonják, saját véleményüket várva a teszteredményekről; a közösségi tapasztalat fontossága is hangsúlyt kap.








