A
A
  • Angol
  • Magyar
  • 16 perc

Történelmi AI tőzsdei bevezetések és az Opus 4.8 újításai az intelligencia határain

Az AI szektorban soha nem látott nagyságrendű tőzsdei bevezetések, izgalmas benchmarkok és új generációs modellek feszítik a piac határait.

Az Anthropic cég történelmi jelentőségű tőzsdei bevezetésre készül, előreláthatólag egy elképesztő, ezer milliárd dolláros értékeléssel. Ezzel együtt példátlan évre számíthatunk, hiszen az iparágban három fontos szereplő – a SpaceX, az Anthropic és az OpenAI – is hasonló nagyságrendű tőzsdei bevezetés előtt áll. Felmerül a kérdés, vajon ez az AI fellendülés valós teljesítményben gyökerezik, vagy inkább egy felfújt buborék sajátosságait mutatja?

A bemutatott technológiai fejlesztések középpontjában áll a Claude Opus 4.8 modell, amely jelentős előrelépéseket mutat különböző benchmark teszteken, többek között az ARC AGI és a Deep Suite kapcsán. Ezekkel szemben az OpenAI is új modellek bevezetését tervezi, mint a pletykák szerint hamarosan érkező GPT 5.6 – ami akár GPT 6 néven is futhatna, figyelembe véve fejlett kódolási képességeit.

A részletes bemutatás során külön kitérnek egy, az Opus 4.8 által teljesen felépített, önálló, szimulált gazdasággal rendelkező benchmark játékra, amely valós gazdasági modelleket, munkaerőpiacot, béralkut és cégek működését képes szimulálni. Ilyen rendszerek tesztelésével próbálják egyre pontosabban mérni, mennyire közelítenek a modellek az emberi gondolkodáshoz, különös tekintettel a fluid intelligenciára és az adaptív problémamegoldásra.

További fontos kérdés, hogy mennyire képesek ezek a modellek újszerű helyzeteket, feladatokat megoldani, és mennyiben támaszkodnak pusztán előzőleg tanult mintákra. A friss benchmarkok célja már nem csupán a pontszámok mérése, hanem a modellek gondolkodási folyamatának vizsgálata is, hogy közelebb kerülhessünk a valódi mesterséges általános intelligencia (AGI) megértéséhez. A videó végén hangsúlyt kap a modellek közötti gyors, éles verseny, amely folyamatos innovációt tesz szükségessé.