Az új, Microsoft által fejlesztett UserLM-8b nyelvi modell egyedülálló megközelítést kínál az AI-alapú párbeszédek szimulálásában. Ezúttal nem az asszisztens szerepét veszi át a mesterséges intelligencia, hanem a felhasználóét, így lehetővé teszi, hogy a gép életszerű, többlépéses felhasználói reakciókat generáljon különböző promptokra.
Az ismertetett videó lépésről lépésre bemutatja, hogyan lehet telepíteni és használni a modellt egy Ubuntu rendszeren, kitérve a szükséges előfeltételekre, mint például a torch és a transformer könyvtárak telepítésére. A bemutató során éles példákkal szemléltetik, miként reagál a modell szokatlan vagy etikai kérdéseket tartalmazó kérésekre, és mennyire viselkedik úgy, mint egy valódi, autonóm felhasználó.
A UserLM-8b modellt a Llama 3 8B alapjára hangolták, és egy nagyméretű, több százezer párbeszédet tartalmazó adathalmazon képezték. A felhasználás fő területei közé tartozik a kutatási célú asszisztens-tesztelés, valamint a szintetikus párbeszédek generálása fejlesztői és UX célra.
A videó során olyan témák is felmerülnek, mint a modell VRAM-fogyasztása, a tanítás során használt adatforrások, illetve a potenciális fejlesztési irányok, például, hogy miként használható komolyabb, emberi felhasználást igénylő helyzetek modellezésére. Emellett kiemelésre kerülnek a technikai határok és problémák is, mint a szűk fókusz, nagy hardverigény és a lehetséges modellezési torzítások.