Az IBM és az Apache 2 fogalmait eddig ritkán láttuk együtt az élvonalbeli mesterséges intelligenciákkal kapcsolatos diskurzusban, mégis most egy teljesen nyílt forráskódú, rendkívül fejlett AI-modell mutatkozik be, amely teljesen szabadon felhasználható licenc alatt működik.
A bemutatott Granite 4.1 nagy hangsúlyt helyez az utasításkövetésre, matematikai logikára, valamint a többnyelvűségre: egyszerre tizenkét nyelven lehet vele kommunikálni, miközben masszív, több mint 130 ezer tokenes szövegablakot kezel. Érdekes kérdések merülnek fel a tanítási folyamattal kapcsolatban is, hiszen a modellt öt jól elkülöníthető szakaszban képezték ki, külön figyelemmel a minőségi adatokra és a matematikai, kódolási feladatokra.
A helyi gépen való futtatás lépéseit és tapasztalatait is bemutatják, beleértve a különböző adatkészletek felhasználását, a GPU-erőforrások igényét, valamint a konkrét méréseket. Különös hangsúlyt kap a modell minőségének ellenőrzése: minden egyes példán keresztül szigorú ellenőrzési folyamaton megy keresztül, hogy a lehető legpontosabb és legmegbízhatóbb választ adja.
A tesztek között szerepel egy teljes Python-eszköz generálása, valós idejű kódfigyelés és automatikus dokumentáció készítése, valamint a többnyelvűség és matematikai feladványok megoldása is. Elgondolkodtató, hogy mennyire közelítenek ezek a nyílt modellek a nagyvállalati szereplők szintjére, és milyen lehetőségeket rejt az IBM új stratégiája a nyílt AI területén.










