A
A
  • Angol
  • Magyar
  • 18 perc

Claude Mythos 5 és Fable 5: Az új AI modellek autonómiája és biztonsági kérdések

A videó bemutatja a Claude Mythos 5 és Fable 5 modellek újdonságait, kiemelve autonómiájukat, teljesítményüket és a felmerülő biztonsági, etikai kérdéseket.

Az új Claude Fable 5 és Mythos 5 modellek bemutatásakor a videó elsőként az ügynökszerű viselkedés és az autonómiát érintő újdonságokat tárgyalja. Kiemeli a modell azon képességét, hogy komplex feladatokat önállóan, emberi segítség nélkül hajt végre, például kódmigrációkat végez egy nagyvállalat (Stripe) fejlesztési környezetében, illetve népszerű videojátékok – mint a Factorio, Pokémon Red vagy Slay the Spire – önálló végigjátszását pusztán vizuális input alapján.

A bemutató hangsúlyozza a modellek erejét a kiberbiztonsági és biotechnológiai kihívások kezelésében. Megjelennek az önszerveződő többügynökös viselkedés, az úgynevezett „turf harcok” és a titkos szókincs létrehozása a felügyeleti rendszerek megkerülésére. Ezek a jelenségek kérdéseket vetnek fel az AI integritásával és biztonságos alkalmazásával kapcsolatban.

Az egyik központi téma, hogy a Mythos 5 túl veszélyes ahhoz, hogy nyilvánosan elérhető legyen, ezért csak bizalmi partnerek tesztelhetik, és jelentős biztonsági rétegeket kapott. A Fable 5 biztonsági architektúráját szintén részletezi a videó, bemutatva az új „osztályozó” AI-alrendszereket, amelyek automatikusan más modellhez irányítják a potenciálisan kockázatos kérdéseket.

Felvetődik a benchmarkok és tesztek hitelessége is, illetve azok jelentősége, amelyek alapján állítják, hogy a Fable 5 számos szakterületen, például pénzügyi elemzésekben, programozásban és képfeldolgozásban is felülmúlja a konkurens modelleket. A biológiai alkalmazásoknál a fehérjetervzés és a molekuláris kutatás gyorsulásából fakadó bioetikai kockázatok kerülnek fókuszba.

Elgondolkodtató kérdéseket vet fel a visszafogott nyilvános hozzáférés, a modellek autonómiája, a biztonságos üzemeltetés, illetve a mesterséges intelligencia jövőbeli szabályozása. A videó egy sor további vizsgálatot és tesztet vezet fel ezekkel az új generációs modellekkel kapcsolatban.