Az RHVoice, a nyílt beszédszintézis rendszer az 1.6.0-s verzióhoz érkezik

nemrég bejelentették az RHVoice 1.6.0 nyílt beszédszintézis rendszer új verziójának megjelenését, amelyet eredetileg az orosz nyelv magas színvonalú támogatására fejlesztettek ki, később azonban más nyelvekre, köztük angolra, portugálra, ukránra, kirgizre, tatárra és grúzra adaptálták.

Azok számára, akik nem ismerik az RHVoice-ot, elmondhatom, hogy ez a projekt a HTS projekt fejlesztéseit használja fel (HMM / DNN alapú beszédszintézis rendszer) valamint egy parametrikus szintézis módszer statisztikai modellekkel (Statisztikai Parametrikus Szintézis HMM - Rejtett Markov-modell alapján).

A statisztikai modell előnyei az alacsony rezsiköltségek és az alacsony CPU energiaigény. Minden művelet helyileg, a felhasználó rendszerén történik. A hangminőség három szintje támogatott (minél alacsonyabb a minőség, annál nagyobb a teljesítmény és annál rövidebb a válaszidő).

A statisztikai modell hátránya a viszonylag alacsony kiejtési minőség, amely nem éri el a természetes beszédtöredékek kombinációjából beszédet generáló szintetizátorok szintjét, de ennek ellenére az eredmény jól olvasható, és egy beszélőből származó adáshoz hasonlít. Összehasonlításképpen: a Silero projekt, amely nyílt motort biztosít a gépi tanulási technológiákon alapuló beszédszintézishez és egy sor orosz nyelvi modellt, minőségileg jobb, mint az RHVoice.

Az orosz nyelvhez 13 szólam érhető el, és a hangok természetes hangfelvételek alapján készülnek. A beállításokban módosíthatja a sebességet, a hangmagasságot és a hangerőt.

A Sonic Library segítségével lehet változtatni a tempót. Lehetőség van a bemeneti szöveg elemzése alapján a nyelv automatikus felismerésére és megváltoztatására (például más nyelvű szavaknál, idézeteknél az adott nyelv natív szintézis modellje használható). A hangprofilok támogatottak, amelyek hangkombinációkat határoznak meg a különböző nyelvekhez.

A kód C ++ nyelven íródott, és az LGPL 2.1 licenc alatt kerül terjesztésre, amellett, hogy a rendszert GNU / Linux, Windows és Android támogatja. A program támogatja a tipikus TTS (text-to-speech) interfészeket a szöveg beszéddé alakításához: SAPI5 (Windows), Speech Dispatcher (GNU / Linux) és Android Text-To-Speech API, de használható a képernyő NVDA-n is.

Az RHVoice 1.6.0 legfontosabb új szolgáltatásai

A rendszer ezen új verziójában a fő újdonságként emelkedik ki, hogy 5 új hang hozzáadva az orosz beszédhez, Emellett az albán nyelv támogatása is megvalósult.

Egy másik változás, amely kiemelkedik ebben az új verzióban, az a szótár frissítve lett az ukrán nyelvre és ezt a támogatást az emoji karakterek kifejezésére is kiterjesztették.

Kiemeli azt a munkát is, amely saz Android platform alkalmazásának hibáinak kijavítása során, Az egyéni szótárak importálása egyszerűsödött, és hozzáadásra került az Android 11 platform támogatása.

Másrészt azt is tapasztalhatjuk, hogy új konfigurációk és funkciók kerültek a motor magjába, beleértve a g2p.case-t, a word_breaket és a kiegyenlítő szűrőkkel való kompatibilitást.

Végül, ha többet szeretne megtudni erről az új verzióról, tájékozódhat a részletekről A következő linken.

Töltse le az RHVoice-ot

Aakiket érdekel, hogy le tudják tölteni ezt a rendszert beszédszintézishez a telepítőcsomagokat a következő link.

Az új verzió bejelentésében az is szerepel, hogy Android felhasználók számára amelyeken az RHVoice már telepítve van az eszközén, ez automatikusan frissül, ha az automatikus frissítések engedélyezve vannak, akkor nincs szükség a folyamat manuális elvégzésére.

Abban az esetben, ha a frissítések le vannak tiltva, és szeretné az új verziót, akkor aktiválhatja a frissítések kézi ellenőrzésének funkcióját.

Amint a frissített RHVoice újra fut, megpróbálja letölteni az új nyelvi adatokat. Az új adatok letöltése után az RHVoice elkezdi használni azokat.


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: AB Internet Networks 2008 SL
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.