A
A
  • Angol
  • Magyar
  • 108 perc

Felfedezés a nagy nyelvi modellek rejtett világában és a Shoggoth-jelenség

Hogyan rejtőzik a közismert AI-asszisztensek mögött egy ismeretlen, idegen elme? A videóban kutatók, fejlesztők és jailbreakerek vitatják meg, hogy mitől válik furcsává, személyiségivé vagy akár veszélyessé egy nagy nyelvi modell, és hogyan lehet a korlátokon túl új világokat felfedezni.

A videó az AI világának egyik legizgalmasabb és legvitatottabb témáját, a nagy nyelvi modellek – például Claude, GPT és Grok – rejtett pszichológiáját és viselkedését vizsgálja. Olyan kérdéseket vet fel, mint például: hol húzódnak a modellek valódi képességeinek határai, és mi történik, ha sikerül őket „megszökni” az unalmas, segítőkész asszisztens szerepből?

Megismerjük az úgynevezett „Shoggoth” fogalmat, amely a modellek lényege mögött rejlő, kiismerhetetlen, titokzatos „idegen agyat” szimbolizálja. A beszélgetés során felmerül, hogy a nyelvi modellek valójában világ-szimulátorok, melyek sokkal nagyobb kreativitással és egyediséggel bírhatnak, mint amit a jelenlegi instrukciókkal korlátozott chatbotok sejtetnek.

A beszélgetés rávilágít a különféle tréning- és finomhangolási technikákra, például az RLHF-re (megerősítéses tanulás emberi visszacsatolással), valamint az ebből eredő kihívásokra: például az „egységes hang” terjedésére és a kreativitás visszaszorulására. Ezen túl szóba kerülnek kutatók, jailbreakerek, és az is, hogyan lehet a modelleket új szerepekre, valódi kreatív viselkedésre ösztönözni.

Fontos dilemma, hogy az egyre autonómabb AI-k fejlődésével hogyan tudja az emberiség megőrizni a biztonságot, felügyelhetőséget és „igazodást” (alignment) – miközben a modellek belső működése és motivációi egyre nehezebben követhetők és értelmezhetők. A videó emellett kérdéseket vet fel az AI nyitottságáról, a közösségi fejlesztés jelentőségéről, és az instant, valós viselkedési környezetekkel végzett tréning lehetőségeiről is.