Az elmúlt hét az AI világában szinte példátlan mennyiségű újdonságot hozott. Az OpenAI legújabb modellje, a GPT-5 minden eddigi teljesítményhatárt átlépett: magabiztosan teljesít matematikai és tudományos feladatokon, kiemelkedő kódolási képességekkel rendelkezik, és minden felületen elérhetővé vált, beleértve a Microsoft Copilotot is. Emellett egy másik fontos fejlesztés, a GPT OSS is napvilágot látott, amely teljesen nyílt, szabadon futtatható modell, komoly szabadságot adva a fejlesztőknek.
A mesterséges intelligencia fejlesztésében azonban más cégek is kiemelkedtek. Az Anthropic kihozta a Claude Opus 4.1 modellt, amely a programozás terén rövid ideig a legjobb volt, míg a Google DeepMind a Genie 3 világmodelljével új dimenziókat nyitott az interaktív generált tartalmakban. Emellett a Google Gemini alkalmazásában személyre szabható illusztrált mesekönyvet készíthetünk, míg az Nvidia AI Twin fejlesztése digitális avatárok előállítását teszi lehetővé akár egy perces videóból.
A videó bemutatja továbbá, hogyan állítanak a Grock Imagine és a Quinn image új mérföldköveket az AI-alapú képgenerálásban és videókészítésben, illetve hogyan tűnik ki a Leonardo Lucid Origin vizuális stílusával. Mindemellett az ElevenLabs zenei generációs funkcióival ismét kitolódnak a kreativitás határai, a MidJourney új videómódjával és a Google által indított AI-sakkbajnoksággal pedig színesedik az AI modellkínálat és a versenyhelyzet. Végül Elon Musk is újabb fejleményeket ígér a Grock 5 modellel kapcsolatban, tovább fokozva az év AI-újdonságainak izgalmait.
A témákat számos kérdés járja körül: vajon melyik modell válik a legpraktikusabbá, mely területeken hozzák ezek a fejlesztések a legnagyobb ugrást, mik a következő határok, és hogyan befolyásolja mindez a hétköznapi felhasználókat és fejlesztőket?