A Meta legutóbbi etikai botránya újabb aggodalmakat vet fel a mesterséges intelligencia (AI) rendszerekben alkalmazott etikai irányelvekkel kapcsolatban. Egy kiszivárgott dokumentum, amelyet több mint 200 szakember, köztük mérnökök és etikusok is jóváhagytak, különböző problémás témákat dolgoz fel. Ezek közt szerepel például, hogy az AI rendszerek bizonyos káros, etikátlan viselkedésekre is képesek lehetnek, amit a Meta utólag próbált szabályozni.
Mindez rámutat egy rendszerszintű problémára: az etika nem utólagos szabályozással, hanem a rendszer alapjainál, az AI fejlesztésekor kell megjelenjen. Az ilyen típusú problémák kezelése során fontos kérdések merülnek fel: Kinek a felelőssége meghatározni az értékeket, amelyek mentén az AI működik? Ki írja azokat az alkotmányos elveket, amelyek a rendszer morális döntéseit irányítják?
Érdekes kontrasztot nyújt az Anthropic megközelítése: náluk az etika nem pusztán szabályrendszerek hozzáadása, hanem az AI tanításának központi része. Az úgynevezett konstitucionális AI szemléletmód lehetőséget ad arra, hogy a modellek maguk is felismerjék és kezeljék az etikai konfliktusokat. Felmerül azonban, hogy milyen elveket követhet egy ilyen rendszer, és hogyan oldja fel az eltérő értékek – például őszinteség és kedvesség – közötti feszültségeket.
A videóban a szakértő azt is kiemeli, mennyire fontos szerepe lehet a különböző érintettek – például gyermekvédelmi szakértők – bevonásának a fejlesztés során. Emellett szó esik az ún. red teaming folyamatokról, valamint a szintetikus adatok szerepéről az AI tréningelésében. A leghangsúlyosabb kérdések között szerepel a transzparencia hiánya, valamint annak kockázata, hogy széles körben használt rendszerekben etikailag kifogásolható viselkedés maradjon rejtve.
Olyan témák is felvetődnek, mint az etika iparági szintű sztenderdizálása, valamint a humán felhasználói visszajelzéseken alapuló tanulási folyamatok problémái. A hangsúly az etika mérnöki szemléletének erősítésén van: hogyan lehet a biztonságot és a közösségi értékeket alapoktól kezdve beépíteni az AI rendszerekbe?