Egy új, nyílt forráskódú AI zenei generátor, a HeartMuLa kerül bemutatásra, amely jelentős hullámokat kelt a zenei mesterségesintelligencia-közösségben. Ezzel a modellel a felhasználók teljes körűen személyre szabhatják a dalokat több nyelven, például angolul, kínaiul, japánul, koreaiul vagy spanyolul, különféle szöveges és hangalapú inputokkal.
Az ismertető kitér a HeartMuLa részletes technikai architektúrájára, ahol négy fő komponens működik együtt: a zenei dekóder, az audio-szöveg igazító, valamint egy dalszöveg-felismerő, amelyek mindegyike hozzájárul a sokoldalú zenei produkcióhoz. A videón keresztül lépésről lépésre követhetjük, miként telepíthető és futtatható helyben a modell, miközben szó esik a hardverigényekről, például kifejezetten egy Nvidia RTX 6000 GPU használatáról.
Feldolgozásra kerül, hogy miként irányítható a generált dalok stílusa és hangulata természetes nyelvi utasításokkal, sőt, a felhasználó akár saját dalszövegeit is felhasználhatja a zenék elkészítéséhez. Szintén érdekes kérdésként merül fel a HeartMuLa teljesítményének összehasonlítása zárt forráskódú konkurenseivel, például a Sunóval, különösen a dalszövegek érthetősége és a zenei minőség terén.
A néző betekintést kap a különféle nyelvű zenealkotás lehetőségeibe, a hangnem és műfaj módosításának lehetőségébe, miközben a technológia rugalmasságát és fejlődési potenciálját is kiemeli az anyag.







