Az utóbbi időben az AI képes volt forradalmasítani a zeneszerzést és dalszerzést is. A SongGeneration nevű, legújabb modellt a Tencent mutatta be, amely izgalmas technológiákat alkalmaz a dalszövegből zeneszámok generálásához – akár helyben, saját gépen is telepíthető.
A Leavo keretrendszerre épülő fejlesztésre különösen jellemző, hogy kétféle audio-reprezentációt kezel párhuzamosan: egyesített és szétválasztott (vokál-hangszer) tokenek révén próbál harmonikus dallamokat és tisztán elkülöníthető sávokat létrehozni. Ezzel a megközelítéssel igyekeznek kiküszöbölni a mesterséges zenealkotás problémáit, mint például a gyenge hangminőséget vagy a vokál és a hangszeres részek közötti harmónia hiányát.
A bemutató során különböző nyelveken tesztelik a rendszert – főként kínai és angol dalokat alkotva, de kísérleteznek a hanggenerálás minőségével, illetve a műfaji beállításokkal is. Felmerül a kérdés, mennyire sokoldalú a modell, képes-e különböző zenei stílusokban, illetve idegen nyelveken élethű dalokat generálni, és mennyire működik megbízhatóan az audio prompt alapú énekhang szimuláció.