Egy új mesterséges intelligencia-modell, a Meta SAM 3 kerül bemutatásra, amely alapjaiban változtatja meg a gépi látás lehetőségeit. Korábban az AI számára hosszadalmas adatcímkézés és képkeretezés volt szükséges egy-egy tárgy felismeréséhez. Most azonban elegendő egy szöveges utasítást megadni – például „bögre” –, és az algoritmus képes végigkövetni azt a teljes videón.
A technológia különlegessége, hogy nincs előzetes tréning kötött kategóriákra. Szinte bármilyen rövid szöveg, akár szín+tárgy kombináció (‘piros lufi’, ‘zöld hátizsák’), egyből alkalmazható, így jelentősen kibővülnek a használati lehetőségek. Több demó példában különféle tárgyak, arcok, rendszámtáblák követése, elhomályosítása vagy háttér cseréje jelenik meg, illetve kreatív effektekkel is kísérleteznek.
Felmerülnek izgalmas kérdések a sokoldalú felhasználás kapcsán, legyen szó kutatókról, vloggerekről vagy tartalomkészítőkről: hogyan tudják majd kihasználni az objektumkövető és -szegmentáló képességeket akár valós idejű alkalmazásokhoz? Továbbá elgondolkodtató, hogy milyen új üzleti ötletek, jövőbeli AR eszközök vagy tudományos felfedezések válhatnak lehetővé ezzel a technológiával.









