A
A
  • Angol
  • Magyar
  • 8 perc

Mercury 2: A diffúziós nyelvi modellek új korszaka

Bemutatkozik a Mercury 2, amely diffúziós elven működő nyelvi modellként gyorsabb, rugalmasabb és hatékonyabb szöveggenerálást ígér, új távlatokat nyitva a mesterséges intelligencia alkalmazásában.

A Mercury 2 egy új generációs, diffúziós alapokon nyugvó nagy nyelvi modell, amely kiemelkedő, több mint 1 000 token/másodperces sebességre képes. Ez a technológia nem az eddig elterjedt autoregresszív módszert használja, hanem a képgenerálásban már sikeresen alkalmazott diffúziós elven működik.

Az Inception Labs által fejlesztett modell forradalmian új szemléletet honosít meg: az outputokat folyamatosan felülvizsgálja és javítja a generálás során. Így a hibák nem terjednek tovább, mint a hagyományos nyelvi modelleknél, hanem időben korrigálhatók. Az előadás során konkrét példákon keresztül mutatja be az előadó, miként hasznosítható a Mercury 2 gyorsasága összetett, eszközöket is igénylő feladatokban.

Kiemelt szerepet kap a latenciaérzékeny alkalmazások támogatása, ahol minden további eszközhívás jelentősen növelheti a várakozási időt. Ezzel a modellel akár 128 000 tokenes szövegkörnyezet is kezelhető, ami rendkívül tág lehetőségeket teremt.

Felmerül a kérdés: vajon a diffúziós megközelítés meghatározza-e a jövő nyelvi modelljeinek fejlődési irányát, vagy az autoregresszív modellek továbbra is vezető szerepben maradnak? Az iparágban jelentős pénzek mozognak a gyorsítási versenyben, ahol mindenki a következő nagy áttörésre vár.