Az Anthropic új, Claude Opus 4.5 nevű nyelvi modellje jelentős előrelépést hozott a mesterséges intelligencia területén, különös tekintettel a szoftvermérnöki feladatok automatizálására és a kódolási ügynökök kezelésére. A bemutató során részletes információkat kapunk a modell fejlett teljesítményéről különböző benchmark teszteken, mint például a SweetBench és a Terminal Bench, ahol kiemelkedő eredményeket ért el.
Az árképzés tekintetében is jelentős újításokat vezettek be, hiszen a működtetés költségei jelentősen csökkentek, miközben a teljesítmény tovább nőtt. Az Opus 4.5 számos platformon elérhetővé vált, így könnyebben integrálható fejlesztői környezetekbe, desktop alkalmazásokba és különböző felhőszolgáltatásokhoz is.
Külön említést érdemelnek az új, a rugalmasságot növelő funkciók, mint például az effort paraméter használata az API-ban, amely lehetővé teszi a felhasználók számára, hogy finomhangolják a modell feladatteljesítési stratégiáit. Az összetett, több ügynökből álló rendszerek kezelése és az autonóm működési képességek fejlesztése szintén központi téma.
További érdekes aspektus a bemutatóban a kép-feldolgozási képességek javítása, illetve a Microsoft alkalmazásokhoz (Word, Excel, PowerPoint) és a Chrome böngészőhöz kiadott támogatás bővítése. A fejlesztőknek lehetőségük nyílik alkalmazásgenerálási feladatokra is, például Next.js alapú weboldalak létrehozására minimális utasítás megadása mellett.
Felmerülnek kérdések arról, hogy mennyire lehet ezekre a rendszerekre rábízni autonóm feladatokat, illetve hogy az emberi szaktudás mely aspektusait képes ténylegesen pótolni vagy túlszárnyalni egy ilyen mesterséges intelligencia modell, különösen abban a tekintetben, hogy az Anthropic híresen nehéz tesztjén is jobban teljesített, mint bármely eddigi emberi jelölt.









