A
A
  • Angol
  • Magyar
  • 13 perc

Heretic: Teljesen automatikus cenzúraeltávolítás nyelvi modelleken

A Heretic nevű eszközzel teljesen automatikusan és helyben távolíthatók el a nagy nyelvi modellek válaszadási korlátai, amely új kutatási és kreatív lehetőségeket nyit meg – de komoly etikai kérdéseket is felvet.

Egyre többen dolgoznak olyan fejlesztéseken, amelyekkel a mesterséges intelligencia modellek korlátait lehet kikerülni. Ez a videó egy Heretic nevű automatizált eszközt mutat be, amely a nagy nyelvi modellek (LLM-ek) válaszadási korlátait oldja fel. Az alkotó részletesen és közérthetően ismerteti, milyen matematikai módszerek teszik lehetővé e biztonsági mechanizmusok lekapcsolását.

Az irányított „ablation” eljárásról is szó esik, amelynek lényege bizonyos mintázatok szelektív eltávolítása a modell súlymátrixaiból. Kiemelkedően érdekes, hogy ez a beavatkozás nem tesz kárt a modell általános képességeiben, csak a „visszautasító” mintázatokat gyengíti le.

A videó külön kitér arra is, hogyan lehet helyileg telepíteni ezt az eszközt, mik a műszaki előfeltételek (például a GPU használata, NVIDIA kártyával, Torch telepítése), és mire érdemes vigyázni a telepítés során. Gyakorlati példákon keresztül azt is bemutatja, milyen kreatív, kutatási vagy akár jogi (pl. kriminalisztikai elemzés) felhasználási területek képzelhetők el korlátok nélkül működő modellekkel.

Miközben az eszköz lehetőségeit sorra veszi, a szerző etikai aggályokat is felvet: vajon milyen veszélyek rejlenek ezekben a technikákban, és hogyan érdemes felelősen alkalmazni őket?