Qwen és Gemma kvantált MI-modellek tesztje valós feladatokban ✦ UMA

Két élvonalbeli, nyílt forráskódú MI-modellt hasonlítanak össze különböző valós feladatok során, kvantált formátumban, helyi GPU-n futtatva.

Ebben a videóban két népszerű, nyílt forráskódú mesterséges intelligencia modellt, a Qwen3.6-35B-A3B-t és a Gemma4-26B-t hasonlítják össze kvantált (Q4_KM) formátumban, helyi környezetben, egyetlen GPU-n futtatva, Ollama segítségével. A különböző tesztek közé tartozik a kódgenerálás, összetett interaktív szimulációk készítése, valamint idegennyelvű fordítások és képelemzés is.

A kódolási feladat során a modelleknek egy monszun szupercella viharrendszert kellett szimulálniuk, amely Indiából Pakisztánba tartó útvonalat követ, procedurális tájgenerálással és összetett fizikai rendszerek alkalmazásával. Részletesen vizsgálják, miként birkóznak meg az MI-k az ilyen igényes, valós idejű szimulációs kihívásokkal, és mennyiben mutatkozik meg a kvantálás kompromisszuma.

A fordítási tesztben a modellek feladata Bob Dylan egyik legismertebb dalrészletének több mint 80 nyelvre történő fordítása volt. Kiemelten elemzik, hogyan találják meg a modellek az adott dal híres sorait, illetve mennyire tudják azok költői hangulatát átültetni más nyelvekre.

Végül képfeldolgozási feladattal tesztelik a modellek képességeit: egy generált közlekedési szituációból a szabályszegések és a forgalmi veszélyek felismerését várják el. Feltárul, mennyire képesek az egyes modellek összetett jelenetek holisztikus értelmezésére és szabályalapú elemzésére.

Az összehasonlítás izgalmas kérdéseket vet fel a kvantált modellek gyakorlati használhatóságáról, valamint arról, hogy mennyiben változnak a teljesítménybeli különbségek különböző, valós életből vett feladatok esetén.

Qwen és Gemma kvantált MI-modellek tesztje valós feladatokban

Hasonló tartalmak:

AMD, Intel és Nvidia: a memóriaárak, biztonsági kérdések és az AI piac új fordulatai

Új PDF-elemző eszköz: OpenDataLoader PDF bemutatója helyi környezetben

Notebook LM 2.0: Gyors és automatizált üzleti adatelemzés percek alatt

AI-alapú logókészítő platformok tesztje és összehasonlítása

Fehér gaming PC építése AM5 platformon 1000 dollárból 2026-ban: tippek és trükkök