A
A
  • Angol
  • Magyar
  • 11 perc

Mi jön az LLM-ek után? John Carmack kihívásai és a gyors tanulású MI-k jövője

John Carmack, a legendás játékfejlesztő új utakat keres a mesterséges intelligencia fejlesztésében, ahol a fókusz a gyors tanuláson és a valós világban való alkalmazkodáson van. Hol húzódik a határ a jelenlegi modellek és a jövő MI-megoldásai között?

Napjainkban a nagy nyelvi modellek (LLM-ek), mint például a ChatGPT vagy a Gemini, rendkívül népszerűek, és számos területen használatosak. Ezek a technológiák már most is lenyűgöző képességekkel rendelkeznek, de sokan úgy vélik, hogy nem ezek jelentik a végső választ az általános mesterséges intelligenciára vonatkozó kérdésekre.

John Carmack, akit a videojáték-ipar úttörőjeként és az Oculus egyik kulcsemberként ismerhetünk, jelenleg új irányokat kutat a mesterséges intelligencia terén. Saját cége, a Keen Technologies keretein belül azt vizsgálja, hogyan lehetne olyan MI rendszert fejleszteni, amely képes nagyon gyorsan megtanulni új feladatokat – például egy soha nem látott Atari 2600 játékot néhány óra alatt elsajátítani.

Az előadásban Carmack hangsúlyozza a gyors tanulás jelentőségét. Míg a mai MI rendszerek elképesztő eredményeket érnek el, ehhez gyakran hónapokon át folyamatosan kell gyakorolniuk egy-egy feladaton. Az emberhez hasonló általános intelligencia viszont rövid idő alatt alkalmazkodik új helyzetekhez, ami jelenleg óriási kihívás az MI számára.

A témában felmerül, hogy miként érhetjük el, hogy a mesterséges intelligencia ne csak bemeneti adatokból és múltbeli tapasztalatokból következtessen, hanem gyorsan megtanuljon teljesen ismeretlen környezetben is eligazodni. Carmack munkája során nem csak szoftveresen, hanem ténylegesen a fizikai világban, robotikai eszközökkel is próbálja a tanulási folyamatokat modellezni, ami számos új kérdést vet fel a kutatások irányával kapcsolatban.

Miközben a nagy nyelvi modellek fejlődése töretlen, más kutatók, köztük Carmack, a továbblépési lehetőségeket és a különféle megközelítések egyesítésének potenciálját vizsgálják. Vajon a jövő mesterséges intelligencia rendszerei ötvözni fogják a gyors tanulás és a mély tudás előnyeit?