A
A
  • Angol
  • Magyar
  • 8 perc

DeepSeek R1: A nyílt forráskódú AI nagy lépése az élvonal felé

Az új DeepSeek R1 modell meglepő előrelépést hozott a nyílt forráskódú AI területén, közelítve a zárt élmezőnyhöz, miközben érdekes teszteken keresztül hasonlítja össze a jelenlegi élvonalbeli mesterséges intelligencia modelleket.

Az új DeepSeek R1 modell jelentős frissítést kapott, amely nagymértékben megnövelte a modell gondolkodási mélységét, következtetési képességeit és programozási teljesítményét. A fejlesztések mögött megnövelt számítási kapacitás és új algoritmikus optimalizációs megközelítések állnak, különösen a tanítás utáni folyamatok során.

Az eredmények alapján a modell már szinte egy szinten van az élvonalbeli 03 és Gemini 2.5 modellekkel, ráadásul továbbra is teljes mértékben nyílt forráskódú és ingyenes. A bemutatott tesztekben, például a matematikai, programozói és logikai benchmarkokon, látványos előrelépések figyelhetők meg, amelyeket részletes grafikonokon szemléltetnek.

Kiemelt figyelmet kap a Rubik-kocka szimulációs teszt, amely jól illusztrálja a különféle modellek programozási képességeinek fejlődését. A modell most már jóval hosszabban és elmélyültebben gondolkodik, hiszen a tesztek lefuttatásához jelentősen több tokent használ fel, mint elődje. Ez az elmélyült gondolkodási folyamat különösen fontos azok számára, akik komplex feladatokra keresnek megbízható AI megoldást.

A videóban független elemzők értékelése is elhangzik, amelyek alapján a DeepSeek laboratóriumi modelljei jelentősen felzárkóztak, sőt bizonyos területeken megelőzték a nagy, zárt forráskódú amerikai AI vállalatokat. Érdekes összehasonlításokat hallhatunk a kínai és amerikai AI fejlesztések jelenlegi állásáról is, valamint arról, hogyan változnak az erőviszonyok a nyílt és zárt modellek között.