A mesterséges intelligencia fejlődésének legújabb fordulata aggodalomra ad okot a világ vezető technológiai cégeinél. Dario Amodei, az Anthropic vezérigazgatója szerint akár már 2027-re olyan fejlett AI-rendszerek jelenhetnek meg, amelyek intelligenciájukban egy egész zseni országával vetekedhetnek. Felmerül a kérdés: tudjuk-e egyáltalán, hogyan működnek ezek a rendszerek, és képesek vagyunk-e kordában tartani őket?
A hagyományos szoftverekkel szemben a generatív AI-rendszerek belső folyamatai teljesen átláthatatlanok – még az alkotók számára is. A kutatók csak hatalmas mátrixokat és számokat látnak, amelyek bonyolult feladatokat oldanak meg, de a pontos mechanizmus ismeretlen marad. Ez nem csupán tudományos rejtély, hanem komoly kockázat is.
Égető kérdés, mit jelenthet, ha ilyen rendszerek irányítják a kritikus infrastruktúrát, a globális pénzügyeket, vagy akár életről-halálról döntenek, miközben senki nem tudja, milyen belső minták alapján születnek a döntéseik. Szóba kerül az interpretálhatósági kutatás: hogyan lehet átlátni, értelmezni ezt a komplexitást, és vajon elég gyorsan halad-e ahhoz képest, amilyen tempóban az AI fejlődik.
A videó kitér azokra a tudományos áttörésekre, amelyek elméleti áttörést jelenthetnek az „AI-agy” feltérképezésében – például az egyes fogalmakat felismerő neuronokra, illetve az úgynevezett szuperpozíció-problémára. Felvetődik, mennyire sürgős, hogy az interpretálhatósági kutatások ne maradjanak le a szuperintelligenciától, valamint milyen szabályozói és geopolitikai lépések segíthetnek az átláthatóbb és biztonságosabb AI-korszak elérésében.
A társadalomnak, a cégeknek és a kutatóknak együtt kell versenyt futniuk az idővel, hogy az emberiség ne essen áldozatául saját teremtményének. Vajon lesz elég időnk megérteni, mivel nézünk szembe?