Különböző valós feladatokon keresztül derül ki, mire képes a ChatGPT új agent módja a gyakorlatban. A bemutatott tesztek között találunk egyszerű, virtuális asszisztens szintű kéréseket – például szálláskeresést vagy alapvető adatgyűjtést –, csakúgy mint összetettebb, több digitális eszközt (például Gmail, Calendar, Drive) kombináló munkafolyamatokat is.
Érdekességként részletesen szemlélteti, hogyan boldogul az ügynök például piaci kulcsszókutatásban, trendek elemzésében, illetve régi, bonyolult weboldalakon való navigálásban és adatkinyerésben. Több esetben hangsúlyozzák, hogy noha a böngésző automatizálás és a valós idejű feladatvégzés nagy előrelépés, az agent mód működése időnként még lassú és hajlamos „hallucinálni”, vagyis hibás következtetéseket levonni.
Felvetődik a kérdés, mennyire lehet kiváltani vele humán munkaerőt adminisztratív vagy kutatási területeken, valamint hogy jelenlegi állapotában mennyire képes önálló, proaktív problémamegoldásra – például ha a folyamatban akadályba ütközik, képes-e beavatkozást kérni a felhasználótól. Végül a videó rávilágít, milyen mértékben tud többféle API-t, böngészőt és szoftveres forrást összekapcsolni egyetlen feladat megoldása érdekében.