A
A
  • Angol
  • Magyar
  • 21 perc

Stable Audio 3: világzenét varázsol a gépedre

A videó bemutatja, hogyan lehet a Stable Audio 3 hanggeneráló modellt helyben futtatni, és vele változatos zenei műfajokat generálni a világ több országából.

Az összeállítás bemutatja a Stable Audio 3 nevű hanggeneráló modellt, amely képes különféle zenei műfajok és népzenei stílusok előállítására, több mint húsz ország zenei hagyományaiból merítve. A hangsúly azon van, hogy mennyire változatos hangzásokat és hangszereket képes létrehozni, többek közt indiai, arab, skót, olasz, spanyol, brazil, pakisztáni, afrikai, orosz, japán, bangladesi, közép-ázsiai és mongol hagyományokat feldolgozva.

Felvezetésként ismerteti a modell különböző változatait, majd technikai szempontból is bemutatja az architektúrát: a Transformer-alapú diffúziós rendszert, az autoenkódert és az ellenséges hálózatokkal támogatott utóképzést, amelyek gyorsabb és hatékonyabb működést tesznek lehetővé. Külön kiemeli, hogy már fogyasztói szintű hardvereken, például egyetlen GPU-val vagy akár MacBook Pro-n is futtatható.

Kísérleti jelleggel számos zenei példán keresztül mutatja be, mennyire képes a modell eltérő kulturális zenéket, hangszereket vagy akár speciális effekteket generálni, köztük hagyományos tánczenéket, vokális tradíciókat és elektronikus hangokat. Rávilágít arra is, hogyan viselkedik a rendszer különböző hangszerelési és rétegzési kihívások során, illetve megemlíti a hangszerek és stílusok valósághűségét, valamint a hanghatások generálásának különbségeit.

A videóban több érdekességet is felvet: vajon mennyi lehetőség rejlik a helyi zenék gépi előállításában, mennyire tudja egy mesterséges intelligencia visszaadni az adott kultúra hangzásvilágát, illetve milyen korlátai vannak egyelőre a zenei vagy zaj alapú modelleknek.