A
A
  • Angol
  • Magyar
  • 9 perc

Miért nem használnak az LLM-ek strukturált adatokat?

A videó rávilágít arra, hogy a strukturált adatok beépítése miért nem befolyásolja számottevően a nagy nyelvi modellek (LLM-ek) keresési eredményeit, és milyen alternatív, ténylegesen hatékony módszereket alkalmazhatnak a cégek.

Az utóbbi időben egyre több vélemény született arról, hogy az úgynevezett strukturált adatok (schema) mennyiben segítik a mesterséges intelligencián alapuló keresőmotorok (LLM-ek) működését. Influencerek és ügynökségek hosszú ideje hangoztatják, hogy a schema elengedhetetlen a jobb láthatósághoz AI-keresésekben, azonban több szakértő is kétségét fejezte ki ezekkel a nézetekkel szemben.

Kísérletek bizonyítják, hogy az LLM-ek, mint a Gemini vagy a ChatGPT, nem használják fel a schemában megadott adatokat kiemelten a tartalom feldolgozása során. Vizsgálatok során az derült ki, hogy kizárólag a látható, szöveges tartalmat képesek felismerni és hasznosítani, míg a strukturált adatok nagy része, például a JSON formátumú információk, jelentősége elvész a tokenizációs folyamatok miatt.

A témában megosztott eredmények azt is érintik, hogy miért költséges és sokszor felesleges a bonyolult schema implementálása, ha nincs igazolt pozitív hatása az LLM-ek általi feldolgozásra. Felmerül az a kérdés is, kinek áll érdekében terjeszteni azt a nézetet, hogy a schema kulcsfontosságú, illetve hogyan lehet valós, AI-nak releváns tartalmat előállítani.

Alternatív megoldásként felmerül annak fontossága, hogy a vállalkozások minél részletesebb, látható szöveges információkat adjanak meg honlapjaikon, például árakat, ügyfélvéleményeket, releváns összehasonlításokat és gyakran ismételt kérdéseket, hogy ezeket a mesterséges intelligencián alapuló rendszerek könnyebben észrevegyék és ajánlják.