A
A
  • Angol
  • Magyar
  • 10 perc

Forradalmi újítások az OpenAI és az Anthropic új Codex és Opus modelljeivel az autonóm kódírásban

Az OpenAI új GPT 5.3 Codex modellje jelentős sebességnövekedést, fejlettebb autonóm kódírási képességeket és innovatív funkciókat kínál — mindezt az iparági verseny élén.

Az iparág két legnagyobb szereplője, az OpenAI és az Anthropic, pillanatokon belül egymás után jelentette be vadonatúj fejlesztéseit: az Opus 4.6 modellt és a GPT 5.3 Codexet, amelyek reflektorfénybe kerültek. Mindkét labor erőteljesen koncentrál a genetikus kódírásra, ami egyértelmű jele annak, merre tart a technológiai fejlődés.

A felhasználói visszajelzések szerint a Codex modellek eddig kiemelkedően jól teljesítettek a kódolás terén, azonban komoly kritikaként merült fel lassúságuk. Ez radikálisan változhat: a fejlesztők szerint jelentős, akár 25%-os sebességnövekedést sikerült elérniük kevesebb token felhasználásával, amely a gyakorlatban is érezhető lehet.

Lenyűgöző gondolat, hogy a GPT 5.3 Codex korábbi verziója aktívan közreműködött saját utódjának fejlesztésében, önállóan diagnosztizálva és tesztelve önmagát. Ez a fajta autonóm önfejlesztés új dimenziókat nyithat a mesterséges intelligencia fejlődésében, különösen a hosszú távú feladatok és ügynökalapú rendszerek világában.

Praktikus példák is alátámasztják az új modell képességeit: teljesen önállóan generált játékok, weboldalak és különböző professzionális dokumentumok születtek csupán rövid szöveges utasítások alapján. Ráadásul a GPT 5.3 Codex immár képes jobb döntéseket hozni hiányos utasítások mellett is, megkönnyítve a kezdő fejlesztők munkáját.

A gyorsaság és kreatív funkcionalitás mellett a jelentés kitér a kódellenőrzés új generációjára is: bemutatják a Grapile-t, amely ismert nagy cégek (pl. Nvidia, PyTorch) kódját is segíti átvizsgálni, és növeli a fejlesztés biztonságát. Ugyanígy szó esik a megújult Codeex alkalmazásról, amely már testreszabható ügynök-menedzsmentet kínál.

Izgalmas kérdés, hogy az új modellek mennyire lesznek sikeresek a gyakorlati alkalmazásban, illetve mely fejlesztőcsapatok nyernek többet az új funkciókból. Az összehasonlításokból kirajzolódik, mennyire eltérően fejlődnek a rivális rendszerek, különös tekintettel a benchmarkingra és a valós felhasználási eredményekre.