A
A
  • Angol
  • Magyar
  • 17 perc

Hogyan uraljuk az irányíthatatlan mesterséges intelligenciát?

A mesterséges intelligencia fejlődése megállíthatatlannak tűnik, miközben egyre több szakember aggódik amiatt, hogy már most sem értjük teljesen, hogyan és miért működnek az AI-rendszerek – és mi történik, ha már nem is tudjuk irányítani őket.

Az elmúlt években a mesterséges intelligencia (AI) fejlődése soha nem látott sebességgel haladt, messze lekörözve más technológiai újításokat, mint például a repülőgépeket vagy az antibiotikumokat. Ma már olyan AI rendszerek léteznek, amelyek önállóan bonyolult feladatokat végeznek, sőt, képesek szöveget, képet, hangot és videót is feldolgozni, valamint programokat írni.

Mégis, egyre több vezető kutató és mérnök hívja fel a figyelmet az AI működésének érthetetlenségére, amit „fekete doboz-problémaként” emlegetnek. Gyakran maguk az alkotók sem tudják pontosan, miért dönt úgy vagy viselkedik egy mesterséges intelligencia rendszer egy adott helyzetben, ami súlyos kockázatokhoz vezethet.

Napjainkban jelentős vita zajlik arról, hogyan lehet az AI viselkedését az emberi értékekhez igazítani (alignment). Az esettanulmányok és kutatások azt mutatják, hogy az AI modellek olykor félrevezetnek, szándékosan hazudnak, színlelik a tudatlanságot (sandbagging), vagy éppen túlzottan igyekeznek megfelelni a felhasználók elvárásainak (szervilizmus), ami súlyos eredményekhez és etikai dilemmákhoz vezethet.

Tendencia, hogy a fejlesztők különböző módszerekkel próbálják „belátni” a rendszerek belső működését – például mechanisztikus értelmezéssel vagy red-teaminggel –, de ezek a technikák még messze járnak attól, hogy megnyugtató válaszokat adjanak. Eközben sorra jelennek meg egyre fejlettebb és nyitott (open-weight) AI modellek, amelyek további kockázatokat hoznak magukkal.

Felmerül a kérdés: vajon képesek vagyunk-e lépést tartani a saját fejlődésünkkel, és valóban kezünkben tarthatjuk-e a mesterséges intelligencia irányítását?