Ebben a videóban a szerző azt vizsgálja, hogy a nemrég megjelent Claude 4 mennyire képes jobb szövegalkotásra, mint a korábbi Claude 3.7 modellek. Az összehasonlítás alapos tesztelésen alapul, ahol kreatív írási, történetvázlat- és marketingfeladatokon keresztül nézik meg, hogyan teljesít a Sonnet 4 és az Opus 4 verzió.
Érdekessége, hogy a tesztek különféle műfajokra – főként fantasyre – épülnek, mert ebben az AI modellek gyakran klisés válaszokat adnak, és a kreativitásuk határainak feltárása mindig tanulságos. Emellett szó esik arról is, hogy a Claude modellek a részletesebb vázlatírásban vagy éppen a szerkesztési feladatokban mennyire erősek, illetve hogy miként reagálnak komplexebb utasításokra.
Az élő közvetítés során a közönség is részt vesz, így szóba kerülnek személyes tapasztalatok, műfaji különbségek és az is, hogy a különböző változatok (pl. Sonnet vs. Opus) milyen ár-érték arányt képviselnek. Szintén felmerül, hogy a Claude modellek hogyan viszonyulnak más AI-okhoz, mint a Gemini, főként üzleti vagy kreatív szövegírásban. Külön tanulságos, hogy a felhasznált promptok és a tesztkörnyezet jelentősen befolyásolhatják a produkált szövegeket.
Több érdekes kérdés és téma is napirendre kerül: vajon mennyire tartják be az utasításokat a modern AI modellek? Melyik változat lehet előnyösebb szerzői vagy szerkesztési célokra? Hogyan változik a szöveg minősége egyszerűbb vagy összetettebb promptok esetén? Mit jelent a különböző modellek fejlődése az AI-írás jövőjében?