Ebben a videóban egy új, OpenClaw-RL névre hallgató módszert ismerhetünk meg, amely jelentősen különbözik a korábban használt „karmok” változataitól. Rámutat arra az újdonságra, hogy ez a rendszer képes alkalmazkodni a felhasználó szokásaihoz, és valóban tanul a párbeszédekből, nem csupán válaszol.
Az architektúra négy, egymástól független, aszinkron komponensből áll, amelyek folyamatosan működnek. Egy különleges lehetőség, hogy az ügynök egyszerre tanul és kommunikál, miközben a háttérben a modell súlyai automatikusan frissülnek a felhasználó visszajelzései alapján.
Kétféle tanítási módszert mutat be a videó: az egyik egyszerűen a válaszok jó vagy rossz minősítésén, a másik pedig részletesebb, szöveges visszacsatoláson alapul, amely konkrét tippeket ad a rendszer fejlődéséhez. Felvetődik a kérdés, mennyire lesz ez a megközelítés hatékony, és hogyan tudja kezelni a folyamatos visszajelzéseket.
Fontos téma a szükséges hardverkörnyezet is, hiszen jelenleg legalább nyolc GPU-t igényel a rendszer futtatása, ami komoly technikai kihívást jelenthet a felhasználóknak. Érdekes kérdésként jelenik meg, mikor és hogyan válhat ez szélesebb körben elérhetővé, illetve mennyire lehet személyre szabható és biztonságos az otthoni, privát infrastruktúrákon futtatva.
A fejlesztési irányok között szerepel a személyes asszisztensek optimalizálása mellett az általánosabb, skálázható gépi ügynökök képzése is. Ezek az új utak felvetik, merre haladhat tovább a mesterséges intelligencia fejlesztése, valamint hogy mikor lesznek ezek az eszközök képesek valóban autonóm módon tanulni és fejlődni.










