Az O3-mini és O4-mini high nevű mesterséges intelligenciamodellek meglepő módon képesek voltak megoldani a világ legnehezebb matematikai feladványainak egy részét egy harminc kiemelkedő matematikus részvételével zajló titkos találkozón. Ezek a modellek már túlhaladták az emberi szintű matematikai problémák szokásos megoldását, és új mércék (mint a Frontier Math Benchmark) bevezetésére volt szükség, hogy képességeiket teszteljék.
A résztvevők közül többen hangsúlyozták, hogy a mesterséges intelligencia néhol még hibás logikával is helyes numerikus választ adott, és sarkítottan magabiztos stílusa miatt fennáll a veszélye annak, hogy az emberek túlságosan megbíznak a válaszokban. Érdekes kérdésként merült fel, vajon mennyire támaszkodhatunk ezekre a modellekre magas szintű problémamegoldás során, illetve képesek-e valóban újszerű matematikai eredmények megszerzésére, vagy csupán mintázatfelismerés történik.
További vizsgálatra került az is, hogy a Google DeepMind rendszerei (pl. AlphaProof, AlphaGeometry, AlphaEvolve), illetve evolúciós alapú AI-megoldások hogyan teljesítenek emberi viszonylatban, és hogy milyen mértékben válhat a mesterséges intelligencia autonóm problémamegoldóvá. Folyamatos vita övezi, hogy ezek az eredmények valódi áttörést jelentenek-e, vagy csak a gépi tanulás illúzióját látjuk a teljesítmény mögött.
Külön hangsúly került az emberi ellenőrzés jelentőségére, hiszen a mesterséges intelligencia jelenleg még nem képes önállóan és hibamentesen új elméletek kidolgozására. Végül felmerül a kérdés, hogyan alakulhat át a matematikus szakma, amennyiben ezek a rendszerek egyre nagyobb teljesítményt nyújtanak, és az együttműködésből milyen új felfedezések és tudományos előrelépések születhetnek.