Az epizód elkalauzol abba a folyamatba, hogyan lehet mesterséges intelligenciát tanítani egy igazi klasszikus árkád játék, a Tempest profi szintű kezelésére. Nem egy előre programozott rendszerről van szó, hanem egy olyan AI-ról, amely mély Q-megerősítéses tanulással a nulláról kezdve sajátítja el a játék összes trükkjét és kihívását – mintha egy robot sokszor elesne biciklizés közben, míg végül megtanul egyensúlyozni.
Részletesen bemutatásra kerül, hogyan lehet a Tempest játékállapotának minden apró paraméterét automatikusan értelmezni a MAME emulátor és Lua szkriptek segítségével, ahelyett, hogy hagyományos számítógépes látási módszerekkel próbálkoznánk. Kiderül, milyen előnyöket ad az, ha közvetlenül a játék memóriájából nyerjük ki az információkat: az AI így szinte „röntgenlátást” kap, látva minden ellenfél, lövedék és játékos aktuális helyzetét, mintha csalókódot használnánk – miközben minden adat vizuálisan is felismerhető egy profi emberi játékos számára.
Külön érdekesség, hogy több MAME példány futtatásával és azok hálózatos kapcsolódásával a tanítás jelentősen felgyorsítható, valamint betekintést nyerünk abba is, hogyan alakítható ki kétirányú kommunikáció a neuronhálós, Python-alapú AI és az emulátor között. Az előadás érinti a használt technológiákat is, mint a PyTorch, a Stable Baselines 3, vagy a nagy teljesítményű szerverhardver.
A néző választ kap arra is, hogyan lehet egy AI-t „irányítani” azáltal, hogy egyfajta szakértői rendszert implementálunk a tanulás korai fázisára, amikor az AI még „gyermekcipőben jár”. A sorozat következő részében a konkrét Lua és Python kód is előkerül majd, lépésről lépésre építve fel az AI-t.