A Mercury 2 egy új generációs, diffúziós alapokon nyugvó nagy nyelvi modell, amely kiemelkedő, több mint 1 000 token/másodperces sebességre képes. Ez a technológia nem az eddig elterjedt autoregresszív módszert használja, hanem a képgenerálásban már sikeresen alkalmazott diffúziós elven működik.
Az Inception Labs által fejlesztett modell forradalmian új szemléletet honosít meg: az outputokat folyamatosan felülvizsgálja és javítja a generálás során. Így a hibák nem terjednek tovább, mint a hagyományos nyelvi modelleknél, hanem időben korrigálhatók. Az előadás során konkrét példákon keresztül mutatja be az előadó, miként hasznosítható a Mercury 2 gyorsasága összetett, eszközöket is igénylő feladatokban.
Kiemelt szerepet kap a latenciaérzékeny alkalmazások támogatása, ahol minden további eszközhívás jelentősen növelheti a várakozási időt. Ezzel a modellel akár 128 000 tokenes szövegkörnyezet is kezelhető, ami rendkívül tág lehetőségeket teremt.
Felmerül a kérdés: vajon a diffúziós megközelítés meghatározza-e a jövő nyelvi modelljeinek fejlődési irányát, vagy az autoregresszív modellek továbbra is vezető szerepben maradnak? Az iparágban jelentős pénzek mozognak a gyorsítási versenyben, ahol mindenki a következő nagy áttörésre vár.










