Az alkotó a mesterséges intelligenciával (AI) kapcsolatos, egyre népszerűbb kérdéskörök egyikét boncolgatja: léteznek-e valódi „világmodellek”, illetve a nyelvi modellek (LLM-ek) mennyiben tekinthetők világmodellnek. Felveti, hogy a különbség talán csak fokozat kérdése, hiszen a modern AI rendszerek – főleg a multimodális modellek – már érzékelik és értelmezik a világ összetett adatait.
A szerző kritikusan elemzi azokat a nézeteket, amelyek szerint a világ nem szavakból áll, és a nyelvi modellek ezért sosem lesznek igazi világmodellek. Érdekfeszítő példákat hoz az állatvilágból: madarak, kutyák, majmok impresszív érzékszervi visszacsatolással, szenzoros intelligenciával rendelkeznek, mégsem mutatnak általános értelemben vett intelligenciát, ami az emberek számára hasznos lenne.
Sorba veszi a közösségi médiában terjedő megállapításokat, cáfolatokat és félreértéseket, különösen a generatív modellek, tokenizáció és szenzormodellek működését illetően. Tiszta példákkal szemlélteti, hogy a predikció (előrejelzés, modellezés) a lényeges módszer, függetlenül attól, hogy szövegekkel, képekkel vagy szenzoradatokkal dolgozunk.
Egyedi figyelmet szentel a szakmai fejlesztéseknek (pl. Nvidia és VLA modellek), valamint a különböző kognitív architektúráknak – betekintést ad a 70-es évek kísérleteitől a mai, fejlett neurális hálózatokig. A végén az alkotó több könyvtervét is említi, amelyek a munka utáni társadalom, a jogok kialakulása és a modern gazdaság témáit vizsgálják.










