Egy átfogó, 1,4 millió ChatGPT promptot elemző kutatás betekintést nyújt abba, hogyan választja ki és hivatkozza meg forrásait a ChatGPT. A vizsgálat a Hrefs támogatásával készült, és feltárja, miként játszanak szerepet a tartalom címe, kivonata és URL-je a hivatkozások sorsának eldöntésében. Kiderül, hogy a kezdeti döntés, amely alapján kinyitja-e egyáltalán az oldalt az AI, ezekre a jellemzőkre épül – még mielőtt a tartalom tényleges szövegéhez hozzáférne.
Érdekes kérdéseket vet fel a kutatás: miért kap az egyik oldal hivatkozást, miközben a másik, látszólag ugyanazon keresésből származó oldal nem kap semmit? Milyen szerepet játszik a cím és az URL természetes nyelvűsége, valamint a tartalom tematikus és szemantikai közelsége? A részletek azt mutatják, hogy a fanout querykhez (belsőleg generált további keresések) való illeszkedés meghatározó tényező.
Meglepően nagy a különbség az egyes forrástípusok között is. A mesterséges intelligencia a legtöbb hivatkozást a keresőmotorokból szerzi; a Redditet például rengeteg információ beszerzésére használja, de végül alig ad ehhez tényleges hivatkozást. A frissesség és a tartalom relevanciája között is izgalmas összefüggések rajzolódnak ki: bár általánosságban a frissebb oldalakat preferálja az AI, adott témákban, főleg a hírek esetében, a döntés még összetettebb.
A videó kitér arra is, hogyan lehet a saját tartalmakat „hivatkozhatóvá” tenni a mesterséges intelligencia számára. Ehhez szakértői tippeket ad, többek között arról, hogyan lehet átlátni, milyen kereséseket futtat a ChatGPT, és hogyan célszerű ezekhez igazítani a tartalom szerkezetét, címeit vagy éppen az URL-eket.










