Dave Plummer, a Microsoftnál évtizedeken át dolgozó, mára nyugdíjas szoftvermérnök saját garázsából kalauzol végig minket a mesterséges intelligencia egyik legfrissebb és legizgalmasabb fejleményén. Megvizsgálja a Deepseek R1 nevű kínai, nyílt forráskódú, hatékony LLM modellt, amely a globális technológiai verseny középpontjába került.
Felmerül a kérdés: Vajon valóban új korszakot jelent-e, hogy már nem csupán a világ nagy játékosai, például az OpenAI és az Anthropic irányítják az AI fejlesztését? Kína megoldása nemcsak költséghatékonyabb, hanem számos paraméterben akár felül is múlja az óriásokat, mint a GPT-4 – mindezt szerényebb erőforrásokból. Ez a tény meglepő, különösen úgy, hogy a fejlesztőknek például Nvidia chipek sem álltak korlátlanul rendelkezésre.
Különös figyelmet kap a Deepseek R1 egyedi felépítése: a distillációs módszerrel kiképzett kisebb modellek kombinálják a nagyobb AI rendszerek tudását egy könnyen futtatható, olcsóbb és elérhetőbb formában. Az is kiderül, mekkora jelentősége van annak, hogy ez a modell már átlagosabb hardveren is működtethető, ezzel demokratizálva az AI használatát.
A videó érinti a Deepseek R1 korlátait is: vajon a kisebb, olcsóbb modellek fel tudják-e venni a versenyt a legmodernebb rendszerekkel, amikor bonyolultabb vagy speciális kérdésekről van szó? Felvetődnek etikai és megbízhatósági kérdések is a nyitottság, a torzítás és a különböző szoftververziók kapcsán.
Végül elgondolkodtató, miképpen átalakíthatja ez az újdonság az egész iparágat, és milyen hatással lehet a globális piaci versenyre az Egyesült Államok és Kína között. Vajon tényleg paradigmaváltást hoz az AI világában?