Ebben a videóban Dave bepillantást enged saját műhelyébe, ahol bemutatja, hogyan fejleszt mesterséges intelligenciát egy játékhoz – és ehhez részben magát az MI-t is alkalmazza. Az epizód során Dave számos technikai részletet magyaráz el, miközben élőben kommentálja a kódot és a folyamatokat, ahogy futnak a Tempest játék több példányán.
Az egyik központi kérdés, hogy milyen módokon lehet optimalizálni egy MI „jutalmazási függvényét”, vagy hogyan lehet úgy módosítani a szakértői rendszert, hogy az óvatosabb stratégiákat sajátítson el a játék során. Dave különös figyelmet szentel a hardverháttérnek is, leírja a gép fő paramétereit, valamint azt, hogy miként lehet ennyi játékpéldányt egyszerre futtatni.
A technikai megközelítést részletesen ismerteti: hogyan nyeri ki a játék állapotát, milyen adatokat ad át az MI modellnek, és milyen döntéseket hoz a különböző játékszituációkban. Rámutat arra, hogy egy-egy apró paramétermódosítás tesztelése igen hosszadalmas lehet, hiszen milliónyi képkockát kell kiértékelni a statisztikailag validálható eredményekhez.
Érdekes témaként vetődik fel, hogy egy modern MI hogyan viszonyul a különböző veszélyforrásokhoz a játékban (például fuse ball-ok, pulsarok, lövések), és miként alkalmazkodik az ilyen kihívásokhoz különböző jutalmak és büntetések révén. Végül Dave kitér arra is, hogy mennyire fontos a megfelelő hardver az MI fejlesztéséhez és tréningjéhez, és néhány trükköt is megoszt munkafolyamatainak felgyorsítására.