Ez a tartalom bemutat egy új, fejlett zene generáló mesterséges intelligencia modellt, az ACE-Step 1.5-XL-t (más néven AEP 1.5 XL Turbo), amelyet helyben, akár a saját gépünkön is telepíthetünk. A videó lépésről lépésre végigvezet a telepítési folyamaton, különös tekintettel a rendszerkövetelményekre és a szükséges szoftverekre. A szerző Ubuntu szerveren, Nvidia RTX 6000 GPU-n demonstrálja a modellel való munkát.
Részletesen bemutatja a modell felépítését: két fő „agy” található benne, amelyek közül az egyik a szöveg alapján határozza meg a zene szerkezetét, tempóját, hangnemét és szövegét, míg a másik az audiofájl generálásáért felel. Az érdekesség, hogy közvetlenül hullámformákkal dolgozik, így a végeredmény egyedülálló hangminőséget kínál, különösen a vokál és a basszus tekintetében.
Különféle teszteken keresztül, különböző nyelveken és stílusokban készülnek zenék: urdu, spanyol, arab, portugál és német példák hangzanak el. Felmerülnek fontos kérdések arról, hogy mennyire tud a mesterséges intelligencia hű maradni az adott műfajhoz, mennyire képes megragadni a dallam és a zenei szerkezet lényegét, valamint hogyan kezeli az idegen nyelvű dalszövegeket.
További témaként szó esik a különböző felhasználási módokról – például egy meglévő dal új stílusba való átkonvertálása (cover), vagy a dal egy konkrét részének újragenerálása (repaint). A szerző hangsúlyozza a rendszer hatékonyságát és a kereskedelmi modellekkel való összehasonlítást, szóba kerülnek aktuális open source és fizetős zene-AI rendszerek eredményei is.










