Az OpenAI legújabb AI-modelljei, az 03 és az 04 Mini jelentős figyelmet keltettek, sokan az intelligencia új szintjeként hivatkoznak rájuk. A bemutató elemzi, mennyire jogos ez a lelkesedés, és számos példát hoz lehetséges túlértékelésükre.
Rávilágít arra, hogy a modellek valóban előrelépést jelentenek a korábbi verziókhoz képest, különösen a tudás, a kódolás és a matematika terén, ám még mindig előfordulnak alapvető hibák és „hallucinációk”. Példákon keresztül láthatjuk, mikor teljesítenek kiválóan, például a versenyképes matematika benchmarkokon, és mikor hibáznak, amikor egy kézenfekvő alternatív lehetőséget figyelmen kívül hagynak.
Érdekesség, hogy a videó összehasonlítást tesz más jelentős AI-rendszerekkel (például Gemini 2.5 Pro vagy Claude 3.7), kitér a felhasználási költségekre, az elérhető képességekre és a multimodális input támogatására is. Felmerülnek a kutatás-fejlesztés etikai aspektusai is, beleértve a modellek felelősségteljes skálázását és a potenciális veszélyeket.
Emellett szóba kerülnek független benchmarkok, teljesítményértékelések és a modellek fejlődési üteme. Felvetődik a kérdés: tényleg elértük az AGI-t, vagy csak marketing túlkapásról van szó? Végül hangsúlyt kap a modellek értékelésének, fejlesztésének és tesztelésének folyamata, illetve hogy a jelenlegi eredmények ellenére milyen további lehetőségek állnak még nyitva.