Hlas je čoraz viac metódou používanou na interakciu s našimi zariadeniami a je jedinou metódou pre tých, ktorí tento typ prístupových metód potrebujú. V každom prípade je celkom pohodlné hovoriť tak, že diktujete text alebo jednoducho zadáte hlasové príkazy do našich systémov, aby mohli robiť nejaké operácie bez použitia rúk. Problém je v tom rozpoznávanie hlasu sú založené na motoroch, ktoré používajú matematické algoritmy na rozpoznávanie reči a nie sú stopercentne spoľahlivé.
Technologický pokrok čoraz viac prináša spoľahlivosť k dokonalosti a systémy umelej inteligencie a veľkých dát tiež veľmi pomáhajú pri enormnom vylepšovaní programov rozpoznávania reči. V poslednej dobe sa vynakladá veľa úsilia na zlepšenie týchto systémov na maximum a mnoho štúdií sa zameriava na to, aby sa zlepšila kontrola a vytvorili z nich rozhranie budúcnosti. Majte na pamäti, že súčasné rozhrania sú pre ľudí menej prirodzené a menej rýchle ako hlas.
Systémy rozpoznávania hlasu budú mať v nasledujúcich rokoch hodnotu asi 10 miliárd dolárov, a preto sa veľké spoločnosti zameriavajú na rozvoj asistentov ako Apple Siri, Microsoft Cortana alebo Mycroft pre Linux, okrem toho, že sa stávajú čoraz populárnejšími a častejšími produktmi ako Amazon Echo, Google Home alebo Apple HomePod pre domácnosť, ako aj integrovaním sofistikovaných systémov rozpoznávania hlasu do pripojených automobilov.
To znamená, náš zoznam nástrojov na rozpoznávanie reči pre systém Linux Sú to:
- Julius: je výkonný modul na nepretržité rozpoznávanie reči s množstvom slovnej zásoby.
- DeepSpeech: je implementácia architektúry Baidu DeepSpeech TensorFLow.
- Simon: pomerne flexibilný softvér na rozpoznávanie reči.
- kaldi: je návrhová sada nástrojov pre C ++ pre výskum rozpoznávania reči.
- CMUSfinga: v tomto prípade ide o mechanizmus rozpoznávania hlasu pre mobilné aplikácie a servery.
- deepspeech.python: je implementácia DeepSPeech s Pythonom a pomocou Baidu Warp-CTC.
Veľmi dobré a bude nejaký dobrý TTS (prevod textu na reč) pre linux?
Vo Windows a Android sú veľmi kvalitné hlasy ako Loquendo, Ivona alebo NeoSpeech, ale nie sú pre Linux. Na Linuxe som vyskúšal hlasy mbrola a picoTTS, ale sú veľmi robotické.
Cepstral ponúka bezplatný hlas Alejandra pre linux, čo je celkom dobré, ale nevedel som, ako ho nainštalovať.
Kráčam rovnako, ak máte dobrý podiel
Na linuxe môžete použiť loquendo s vínom. Odporúčam toto video ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Pokúsil som sa nainštalovať asistenta, teda Google Assistant a nemohol som, zostal som v časti súboru registra, myslím, že sa volá. Škoda, že Alexa je svinstvo ...
Program espeak pracuje na konzole espeak debian apt install. A pripojte sa napríklad espeak -ves «Hello World»
the -ves je v = hlasy sú = španielčina
Máte veľa možností, ako prečítať textový súbor, zapísať výsledok do súboru wav.
pozdravy
pravda je veľmi zlá, okná, ktoré sú iným svetom ... tu zaostávajú o 10 rokov
A o 3 roky neskôr áno! toto je ešte po termíne.