Egy különleges kísérlet keretében egy modern nagy nyelvi modellt, a Claude Sonnet 3.7-et bízták meg egy valós, kis méretű bolt teljes irányításával. A projekt célja az volt, hogy feltérképezzék, miként boldogul egy mesterséges intelligencia a napi üzletmenettel, a döntéshozatallal és a vásárlói igények kiszolgálásával önállóan, emberi beavatkozás nélkül.
A rendszert ellátták alapvető digitális eszközökkel – például webkeresővel, e-mail és Slack kapcsolattal –, illetve csak akkor vehetett igénybe emberi segítséget, ha annak költségeit is figyelembe vette. Különösen izgalmas kérdés volt, hogy miképp tud a Claude alkalmazkodni az olyan váratlan vásárlói kívánságokhoz, mint például a speciális vagy szokatlan árucikkek beszerzése.
A projekt során számos, a mindennapi üzletvezetésre jellemző helyzet adódott. Foglalkoztak az árképzés, a készletgazdálkodás, az ügyfélszolgálat és a pénzügyi döntéshozatal kérdéseivel. Külön felmerültek az olyan problémák, mint a hosszú távú stratégiai tervezés, vagy a mesterséges intelligenciára jellemző úgynevezett „hallucinációk”.
Az eredmények között voltak sikerek, de számos váratlan hiba is. Megvizsgálták, mennyire képes az MI felismerni a nyereséges lehetőségeket, elkerülni a veszteségeket, illetve milyen mértékben tudja a valóságot pontosan modellezni – különösen a memória és a kontextus kezelésének korlátait. A projekt arra keresett választ, vajon mennyire vannak már közel ahhoz, hogy autonóm ügynökök valóban gazdaságilag értelmezhető vállalkozásokat működtessenek önállóan.