Az EdgeTam egy innovatív mesterséges intelligencia modellt mutat be, amelyet a Facebook (Meta) fejlesztett ki, és kifejezetten mobil eszközökre és edge rendszerekre optimalizáltak. Fő fókusza a videók szegmentálása és objektumkövetése valós idejű, erőforrás-kímélő módon, akár egyszerűbb hardvereken is.
Érdekes technológiai kihívásként jelenik meg a memóriakezelés és a hatékony modellarchitektúra, különösen a kép- és videófeldolgozás során fellépő számítási igények csökkentése érdekében. Az EdgeTam egy új 2D spatial perceiver modult alkalmaz, amely speciálisan a keretszintű memóriák tömörítésére készült.
A nézők betekintést kapnak a telepítési és használati lépésekbe, például hogyan lehet felállítani a környezetet és tesztelni a modellt saját videókkal. A gyakorlati szemléltetés mellett szó esik az erőforrásigényekről, azok optimalizálhatóságáról, illetve a kompatibilitásról különböző SAM 2 variánsokkal.
A videó érinti azokat a kérdéseket is, hogyan biztosítható a kiváló minőségű szegmentálás és objektumkövetés, miközben a VRAM- és CPU-használat alacsony marad. További témaként jelenik meg, hogy a fejlesztők maguk is kipróbálhatják a modellt saját helyi rendszereiken. Szponzorként megjelenik a Camel AI közösség is, amely a mesterséges intelligencia alkalmazási lehetőségeit kutatja különböző területeken.