A
A
  • Angol
  • Magyar
  • 38 perc

Új AI modellek és fejlesztések: a múlt hét legérdekesebb hírei

Egy villámgyors összefoglalóban mutatják be, hogyan forgatta fel az elmúlt hét a mesterséges intelligencia világát új modellekkel, fejlesztésekkel és meglepő alkalmazásokkal.

Az elmúlt hét AI híreit egy villámgyors összefoglalóban mutatják be, ahol a mesterséges intelligencia fejlesztői és kutatói szinte egymásra licitálnak a bejelentésekkel. Az első részben új képalkotó modellek kerülnek fókuszba: az OpenAI GPT Image 1.5, a Google Nano Banana Pro, illetve a Black Forest Labs Flux 2 Max modellje, amelyek képgenerálási, szerkesztési és stílusmódosító képességeit kreatív példákkal tesztelik.

A hangszegmens-izolációra alkalmas audio modellekről is szó esik, például a Meta új eszközéről, amely zenei sávokat vagy beszédhangokat képes kiemelni, valamint az AI-alapú alkalmazáskészítő fejlesztések lehetőségeiről, amelyeket egy új mobilos platform, a Vibe Code demonstrál.

A videós AI modellek is jelentős frissítéseken estek át: többek közt az Adobe Firefly promptalapú videószerkesztési funkciója, a Luma AI Ray 3 Modify modell képkockák közötti animációja, illetve a Clling Video 2.6 mozgás- és hangszinkronizációs képességeit is bemutatják. Új fejlesztésekkel rukkoltak elő olyan cégek is, mint az Alibaba (Juan 2.6) és a Runway (ML4.5).

A gyorshírek között több nagy LLM (nagy nyelvi modell) megjelenése is helyet kapott, például a Google Gemini 3 Flash és a Xiaomi Mimo V2 Flash, valamint a Microsoft új képből 3D-modell generátora, a Trellis 2. A felmerülő témák közé tartozik a mesterséges intelligencia térhódítása az űrben, a digitális adatközpontok jövője, illetve az AI-alapú hang- és képfeldolgozás mindennapi alkalmazási lehetőségei.

Felmerülnek kérdések az AI modellek megbízhatóságáról, az újítások felhasználhatóságáról, illetve arról, hogyan változik a munka, a kreativitás és a digitális tartalomgyártás világa a gépi tanulás extrém gyors tempójával.