A Meta új SAM 3 modellje forradalmasítja a gépi látást szöveges kulcsszavak alapján ✦ UMA

A Meta legújabb SAM 3 modellje forradalmasítja a gépi látást; szöveges kulcsszavak alapján képes objektumokat felismerni, követni és kiemelni, ezzel számos új lehetőséget megnyitva a tartalomkészítés és kutatás terén.

Egy új mesterséges intelligencia-modell, a Meta SAM 3 kerül bemutatásra, amely alapjaiban változtatja meg a gépi látás lehetőségeit. Korábban az AI számára hosszadalmas adatcímkézés és képkeretezés volt szükséges egy-egy tárgy felismeréséhez. Most azonban elegendő egy szöveges utasítást megadni – például „bögre” –, és az algoritmus képes végigkövetni azt a teljes videón.

A technológia különlegessége, hogy nincs előzetes tréning kötött kategóriákra. Szinte bármilyen rövid szöveg, akár szín+tárgy kombináció (‘piros lufi’, ‘zöld hátizsák’), egyből alkalmazható, így jelentősen kibővülnek a használati lehetőségek. Több demó példában különféle tárgyak, arcok, rendszámtáblák követése, elhomályosítása vagy háttér cseréje jelenik meg, illetve kreatív effektekkel is kísérleteznek.

Felmerülnek izgalmas kérdések a sokoldalú felhasználás kapcsán, legyen szó kutatókról, vloggerekről vagy tartalomkészítőkről: hogyan tudják majd kihasználni az objektumkövető és -szegmentáló képességeket akár valós idejű alkalmazásokhoz? Továbbá elgondolkodtató, hogy milyen új üzleti ötletek, jövőbeli AR eszközök vagy tudományos felfedezések válhatnak lehetővé ezzel a technológiával.

A Meta új SAM 3 modellje forradalmasítja a gépi látást szöveges kulcsszavak alapján

Hasonló tartalmak:

Whimo: Az önvezető taxizás jövője a mindennapokban

A Bitcoin szerepe az energiaár-válság és az AI forradalom idején

iPad vagy MacBook Neo: egy hét használat után melyik a jobb választás?

Az Intel új GPU funkciója gyorsítja a játékbetöltést shaderekkel

Új, olcsó MacBook az Apple-től: kihívás a Windows laptopoknak