Az OLMo 3.1 modell: nyitottság és praktikus tesztek a mesterséges intelligencia világában ✦ UMA

Bemutatkozik az LNAI OLMo 3.1 modell, amely példátlan átláthatóságot és nyitottságot hoz a mesterséges intelligencia fejlesztésébe, miközben különféle gyakorlati teszteken keresztül mutatja be képességeit.

Az LNAI bemutatja a piac egyik legnyitottabb mesterséges intelligencia modellcsaládját, az OLMo 3.1-et, amely nem csupán a súlyokat, hanem a teljes képzési folyamatot is publikussá teszi. A fejlesztők nyilvánossá tették a 32 milliárd paraméteres modellek ellenőrzőpontjait, minden tréningadatot, naplót, finomhangolási szkriptet és hiperparamétert is – mindezt Apache 2 licenc alatt.

A videóban részletesen megismerhető, hogyan épül fel a „gondolkodó” modell: klasszikus dekóder-alapú transformer architektúra, de különlegességét a többlépéses tréning receptje adja. Megtudhatjuk, milyen adatforrásokból és lépéseken keresztül történt a pre- és poszt-tréning, valamint az emberi preferenciák alapján végzett finomhangolás.

Praktikus példákon keresztül mutatja be, hogyan képes a modell önállóan HTML alapú drónparancsnoki központot készíteni, interaktívan reagálni különböző billentyűparancsokra, sőt, még vizuális szimulációt is generálni. A modellel végzett nyelvi és kreatív tesztek megmutatják a sokoldalúságát, például hogy mennyire tud többnyelvű feladatokat végrehajtani, mennyire koherens történeteket vagy mondatokat alkotni egy adott szóval.

A funkciók közé tartozik az eszközmeghívás (tool calling) képessége is, amellyel a modell külső API-kkal, például tőzsdeindex-lekérdező funkciókkal is képes kommunikálni. A különböző példák alapján rávilágít arra, hogy a teljes modellpipeline mennyire átlátható – így akár magunk is újraképezhetjük vagy továbbfejleszthetjük a modellt.

Az OLMo 3.1 modell: nyitottság és praktikus tesztek a mesterséges intelligencia világában

Hasonló tartalmak:

Új szintre lép a szöveggenerálás: itt a LLaDA2.1-mini

OpenClaw: a mesterséges intelligencia asszisztens, ami minden digitális feladatot megold

Cling 3.0: Az AI videógenerálás új szintje és versenytársaihoz mért teljesítménye

AI ügynökök csapatmunkája: a jövő a valós idejű kódolásban

Schematron-3B: helyi mesterséges intelligencia a hatékony webes adatkinyeréshez