A
A
  • Angol
  • Magyar
  • 9 perc

SkillOpt: Új módszer AI ügynökök helyi tanítására súlyhangolás nélkül

A SkillOpt egyedi módszert kínál az AI ügynökök tanítására súlyhangolás nélkül, helyi futtatással és szöveges skill dokumentumok fejlesztésével.

Új megközelítést mutat be a mesterséges intelligencia ügynökök tanításához a Microsoft Research SkillOpt nevű fejlesztése. A fő ötlet az, hogy nem a modell súlyait módosítják, hanem egy „skill dokumentumot” tanítanak, amely egy egyszerű markdown fájl – így bármilyen feladatra egyedi működési utasításokat lehet összeállítani.

Technikai oldalról részletesen bemutatja, hogyan működik a tanítási ciklus: a kiválasztott modell, például Qwen 3.5, helyben fut vLLM-mel, és feladatokat old meg a skill dokumentum alapján. Egy optimalizáló modul átnézi a feladatok eredményeit, módosítja az utasításokat, majd ezeket validálják, és csak a javulást elérő változtatások maradnak meg.

Az eljárást egy háztartási szimulátoron, az ALFWorld/ALFRED benchmarkon ellenőrzik, ahol egy AI-nak szöveges utasításokkal kell feladatokat végrehajtania, például „mosott alma elhelyezése a hűtőben”. Külön figyelmet kapnak a skill dokumentumokban kialakuló explicit szabályok és eljárások, amelyek megelőzik, hogy az ügynök például egy fiókot többször is átvizsgáljon feleslegesen.

Felmerülnek kérdések, hogy az ilyen módon tanított készségek hogyan általánosíthatók más feladatokra, milyen előnyei vannak a súlyhangolás nélküli tanulásnak, illetve hogy milyen egyéb területeken lehet alkalmazni ezt a módszert, például táblázatkezelésben vagy jogi levelezésben.