A
A
  • Angol
  • Magyar
  • 14 perc

NVIDIA PersonaPlex: a beszélgető AI új korszaka

Az NVIDIA PersonaPlex új szintre emeli a beszélgető AI-technológiát, valós idejű, testreszabható és természetes társalgási élményt kínál különféle szerepekben és hangokon keresztül.

Az NVIDIA PersonaPlex-et bemutató videó a hangalapú mesterséges intelligenciák fejlődését helyezi fókuszba, különös tekintettel arra, hogy eddig milyen nehezen tudtak természetes beszélgetést folytatni a felhasználóval: a válaszidő lassú volt, a megszakításokra érzéketlenek voltak, és gyakran túlságosan gépiesnek tűntek. Ezek a problémák több, egymástól független modell láncolatából adódtak, amelyek elkülönítve végezték a hallgatás, a gondolkodás és a beszéd feladatait.

Megjelenik az új NVIDIA PersonaPlex modell, amely egy 7 milliárd paraméteres, valós idejű, teljes duplex kommunikációra képes rendszer. Ennek köszönhetően a beszélgetés áramlóbb, a modell képes egyszerre hallgatni és beszélni, alkalmazkodik a felhasználó megszólalásaihoz, sőt akár zavartalanul fenntart bármilyen, előre meghatározott ‘szerepet’ és hangot. Ez utóbbit szabad szöveges leírás alapján is be lehet állítani, így akár ügyfélszolgálatos, barát vagy bármilyen más személyiséget felvehet.

A videóban végigkövethetjük a telepítési folyamatot Ubuntu rendszerre, bemutatásra kerül a szükséges erőforrás-igény (például Nvidia RTX 6000 GPU), illetve szó esik arról is, hogyan lehet a Hugging Face platformról letölteni, valamint regisztrálni a modellt.

Tesztelés során több különböző szituációt és szerepet láthatunk, például baráti beszélgetést és ügyfélszolgálatos AI-t, amelyek során a rendszer rugalmasságát és párbeszéd-képességét próbálják ki. Rámutatnak néhány kihívásra is, mint például a néha félreértelmezett kérdésekre adott válaszok, vagy egyes, még fejlesztésre váró szempontok.

Érdekes kérdéseket vet fel az AI jövőjével kapcsolatban: vajon mennyire válhatnak természetessé ezek a rendszerek, milyen hatással lehetnek a mindennapi kommunikációra, illetve milyen további szerepeket és alkalmazási területeket tesz lehetővé egy ilyen szinten testreszabható hangalapú AI?