A
A
  • Angol
  • Magyar
  • 9 perc

Új szintre emeli a többnyelvű szövegfelolvasást a SuperTonic 2

A SuperTonic 2 egy ultragyors, többnyelvű szövegfelolvasó rendszer, amelyet teljesen helyben, böngészőben is futtathatsz – egyszerű telepítés, többféle nyelv és valódi adatvédelem.

A SuperTonic 2 egy új, villámgyors, többnyelvű szövegfelolvasó (TTS) megoldás, amelyet teljesen a felhasználó saját eszközén, internetkapcsolat és felhőszolgáltatás nélkül lehet futtatni. A bemutató során részletesen megismerhetjük, hogyan történik mindez egyszerűen egy böngészőben vagy akár helyi Python, Rust vagy Swift környezetben.

Kiemelt figyelmet kap a SuperTonic 2 kiemelkedő sebessége és hatékony működése: mindössze 66 millió paraméterrel is képes reális minőségű hangot generálni, ráadásul több nyelven, köztük angolul, koreaiul, spanyolul, portugálul és franciául. A licenc ingyenes (MIT), így bárki kipróbálhatja saját gépén.

A videó gyakorlati lépéseken keresztül mutatja be az eszköz helyi telepítését, konfigurálását Ubuntu operációs rendszeren – a folyamat során szó esik különböző programnyelvekről, függőségekről, valamint a Hugging Face platformról is, ahol a modellek letölthetők.

Olyan kérdések is felmerülnek, mint a valós idejű feldolgozás lehetősége, a magánszféra védelme, illetve hogy mennyire felel meg különböző nyelveken a hangminőség, valamint mely erőforrásokra van szükség a futtatáshoz. A narrátor különféle demókat tesztel, bemutat különböző nyelvű és hangszínű felolvasásokat, valamint érdekességként néhány ritkább nyelvvel is próbálkozik.