Különleges áttörésekről számol be az új, kisméretű mesterséges intelligencia modellek terén a technológiai világ: a Meta bemutatta a MobileLLM R1 modellt, amely mindössze 950 millió paraméterrel képes összetett logikai feladatok megoldására, akár mobil eszközökön vagy CPU-n is futtatva.
A bemutatott modell abban különleges, hogy eddig a fejlett érvelés és lépésről lépésre történő problémamegoldás kizárólag nagy, több tízmilliárd paraméteres modellek privilégiuma volt. A mostani fejlesztés célja, hogy bizonyítsa: ilyen képességeket jóval kisebb, erőforrástakarékos rendszer is el tud érni. Felmerül a kérdés: mennyire képesek ezek a „zsebre vágható” modellek valós tudományos, matematikai vagy programozási problémák megoldására?
A videó gyakorlati demóval is szolgál, ahol a néző betekintést nyerhet a helyi telepítés menetébe, valamint a különféle feladattípusokra adott válaszok (például matematikai bizonyítás, programkód generálás, fizikai számítások) minőségébe. Felvetődik a kérdés, hogy mikor és milyen célokra érdemes felhasználni egy ilyen, felügyelten finomhangolt, szűkebb témájú modellt.
Ezen túl részletesen szó esik a Meta által alkalmazott tréningmódszerekről, amelyek lehetővé tették a modellek hatékonyságát. Egy további izgalmas aspektus, hogy a felhasználók saját adathalmazzal is tovább finomhangolhatják a modellt, így teljesen személyre szabott megoldások hozhatók létre. Kérdés, hogy a benchmark tesztek mennyire tükrözik a való életben várható teljesítményt, illetve milyen hatása lehet ennek az egész AI-iparra.