Március 8-án Andrej Karpathy egy mindössze 630 soros Python szkripttel új utat nyitott a mesterséges intelligencia fejlesztésében. Egy AI-ügynököt irányított a saját tréningkódjára, egyetlen mérőszámot adott neki optimalizálásra, majd magára hagyta a folyamatot. Két nap alatt a rendszer 700 kísérletet hajtott végre, több valódi fejlesztést talált, sőt egy rejtett hibát is észrevett egy hónapokon keresztül optimalizált kódbázisban.
Ezt a mintát gyorsan átvette egy kis startup, a Third Layer, amely az „ügynökhámok”, vagyis ügynökök működését szabályozó keretek optimalizálására használta. Egy meta-ügynök éjszaka teljesen újraírta az alatta dolgozó ügynökök vezérlését, és állítása szerint a legjobb eredményeket érte el két jelentős benchmarkon, ahol minden más bejegyzést emberek kézzel hangoltak.
A folyamat kulcsa a „Karpathy-hurok”: egy minimalista, célzott optimalizáció egyszerű szabályokkal és gyors visszacsatolással. Ez az architektúra nemcsak kódtréningre alkalmazható, hanem például üzleti folyamatokra, ügyfélszolgálati vagy csalásfelderítő rendszerekre is. A kérdés, hogy meddig és milyen gyorsan lehet ezt a módszert terjeszteni, és hogyan tudnak a szervezetek megbirkózni a saját értékmérőik pontos meghatározásával.
A videó bemutatja, hogy a gyors iteráció, szűk keresési tér, világos mérőszám és automatikus visszacsatolás milyen komoly versenyelőnyt adhat kis és agilis csapatoknak. Szó esik az AI-ügynökök által generált új típusú hibákról, a kontrollálatlan előrehaladással járó kockázatokról, a szervezeti felkészültség jelentőségéről, és arról is, hogyan állnak nagy laborok (mint az Anthropic vagy az OpenAI) a teljesen önfejlesztő rendszerekhez.
A bemutatott példák, elméleti háttér és esettanulmányok sorra veszik az ügynökalapú optimalizálás kihívásait, például a túlzott optimalizációt, metrikamanipulációt vagy a megfigyelési infrastruktúra fontosságát. Új kérdéseket vet fel az értékelés, a vállalati irányítás, az auditálhatóság és a biztonság szempontjából is. Végül gyakorlati tanácsokat ad: hogyan érdemes bevezetni az auto-optimalizálás lépcsőit akár egyéni, akár szervezeti szinten.








