Közelebbről megismerkedhetünk a Google új, Gemini 3 nevű mesterségesintelligencia-modelljével. A szerző felhívja a figyelmet arra, hogy az utóbbi időben lassulni látszik az MI-fejlesztések tempója, így különösen nagy várakozás övezte ezt a megjelenést. Az első tapasztalatok és benchmark-eredmények alapján ígéretesnek tűnik a modell, de szó esik arról is, hogy a valódi értéke a gyakorlati, életszerű helyzetekben derül ki igazán.
Bemutatásra kerül, hogyan viselkedik a Gemini 3 Pro felhasználói környezetben. Tesztelés során a modellnek kreatív programozási feladatokat kell megoldania, például egy animált, focizó rajzfilmfigura vagy egy látványos 3D Rubik-kocka HTML-ben történő megvalósítását. Érdekes kérdéseket vet fel, hogy mennyire részletesen és pontosan érti meg az utasításokat, valamint hogy képes-e hibakeresésre és finomhangolásra valós időben.
A videó kitér a Gemini modellek multimodalitására is: feltöltenek egy rövid videót, amelyhez világítási tanácsokat kérnek, illetve elemzik egy hangfelvétel meggyőzőerejét. A fordítási képességeket is próbára teszik különböző nyelveken, köztük ritka és fiktív nyelveken is. Rámutatnak a modell erősségeire, ugyanakkor felmerülnek még fejlesztendő területek is, főleg összetett, kreatív vagy logikai problémák esetén.
Felvetődik a kérdés, hogy a közösségi médiában tapasztalható lelkesedés mennyire felel meg a valós használat során szerzett élményeknek. A videó nem ad végső választ arra, hogy valóban mindentudó-e ez a modell, de izgalmas példákon keresztül világít rá a jelenlegi lehetőségekre és kihívásokra.










