Az elmúlt hetekben a mesterséges intelligencia fejlesztések terén számos izgalmas újdonság jelent meg, amelyek közé tartozik a Google legújabb bejelentése, a Gemini 3.1. Ez a frissített nyelvi modell jelentős előrelépést mutat a problémamegoldás és az absztrakt gondolkodás területén, sőt, már különböző teszteken is felülmúlta az emberi átlagot.
Zene terén a Lyria nevű zenealkotó AI fejlesztésre került, amely multimodális képességeivel nemcsak szöveges, hanem képi promptokra is képes rövid dallamokat komponálni, így a felhasználók egy fénykép alapján is új dalokat generálhatnak. Ezzel új kreatív lehetőségek nyílnak mind hobbi zenészek, mind tartalomkészítők előtt.
Egy másik friss fejlesztéssel, a Google PhotoShoot-tal, akár egy rossz minőségű termékfotóból is profi marketingképek hozhatók létre, néhány kattintással pedig komplett hirdetési kampányok is kialakíthatók. Ez különösen érdekes lehet azok számára, akik online értékesítenek vagy vizuális tartalmakat gyártanak.
A Magnific videó-upscaler hosszú idő után új funkcióval egészült ki, lehetővé téve a kreatív videó felbontásnövelést. Működés közben különféle kreatív beállításokat és effekteket alkalmaz, ugyanakkor furcsa „AI-szellemeket” is létrehozhat a képkockákon, például arcvonásokat oda, ahol eredetileg nem voltak.
Végül szó esik a Midjourney 8-as verziójáról is. A közösség számára már elérhetőek az első betekintések a modell képességeibe, javuló szövegkezeléssel, pontosabb promptértelmezéssel, és várhatóan gyorsabb, koherensebb képgenerálással. A várakozások szerint a következő hetekben még több újdonság érkezik a kreatív AI terén.










