Google Gemini 3 bemutató: új funkciók és fejlesztések az AI világából ✦ UMA

A Google bemutatta a Gemini 3-at, amely új multimodális képességekkel, fejlett ügynök funkciókkal és kreatív alkalmazásokkal emeli magasabb szintre a mesterséges intelligencia technológiát.

Megérkezett a Google Gemini 3 mesterséges intelligencia modell, amelyre sokan vártak, és most új funkciókat is kínál. A fejlesztések közé tartozik többek között a multimodális feldolgozás, amely nemcsak szöveg, hanem kép, videó és egyéb adatok megértésére és értelmezésére is képes.

Az újdonságok között szerepel a Gemini Agent, amely kutatási feladatokat összekapcsolhat a Google-fiókon belüli szolgáltatásokkal, például a Gmaillel és a naptárral, és akár élő böngészést is végezhet. Kiemelt figyelmet kap a multimodális gondolkodás mérése, valamint annak vizsgálata, hogy a modell mennyire képes kreatív szövegalkotásra vagy kódgenerálásra.

A videó rávilágít arra is, hogy a gépi tanulásos modellek fejlődése mennyire gyors: alig egy év alatt jelentős előrelépést értek el sikerességükben. Emellett bemutatják, hogyan segíthet a Gemini 3 a videojátékokban, kódolásban és kreatív írásban, valamint milyen interaktív felhasználói felületek jelennek meg az új dinamikus prezentációs lehetőségekkel.

Felmerülnek olyan kérdések, mint például mennyire számítanak a benchmark tesztek, hogyan fejlődnek az ügynök funkciók, és hol lehetnek még további kitörési pontok vagy korlátok ezekben az új AI rendszerekben.

Google Gemini 3 bemutató: új funkciók és fejlesztések az AI világából

Hasonló tartalmak:

AI ügynökök térhódítása: Miért hagyjuk hátra a hagyományos csevegőalkalmazásokat?

Írók technológiai vitája a Linus Tech Tips-nél: Mennyire értenek egyet a csapattagok?

AI szingularitás küszöbén: az Nvidia, Anthropic és a Tesla formálják a jövőt

Az emberi ítélőképesség nélkül az AI vakon működik: a memóriakorlát és szervezeti tudás fontossága

Samsung DeX vs. Google desktop mód: Melyik uralja 2026-ban a mobil asztali élményt?