Najlepšie nástroje na rozpoznávanie reči pre Linux

Najlepšie nástroje na rozpoznávanie reči pre systém Linux

2 minút

Hlas je čoraz viac metódou používanou na interakciu s našimi zariadeniami a je jedinou metódou pre tých, ktorí tento typ prístupových metód potrebujú. V každom prípade je celkom pohodlné hovoriť tak, že diktujete text alebo jednoducho zadáte hlasové príkazy do našich systémov, aby mohli robiť nejaké operácie bez použitia rúk. Problém je v tom rozpoznávanie hlasu sú založené na motoroch, ktoré používajú matematické algoritmy na rozpoznávanie reči a nie sú stopercentne spoľahlivé.

Technologický pokrok čoraz viac prináša spoľahlivosť k dokonalosti a systémy umelej inteligencie a veľkých dát tiež veľmi pomáhajú pri enormnom vylepšovaní programov rozpoznávania reči. V poslednej dobe sa vynakladá veľa úsilia na zlepšenie týchto systémov na maximum a mnoho štúdií sa zameriava na to, aby sa zlepšila kontrola a vytvorili z nich rozhranie budúcnosti. Majte na pamäti, že súčasné rozhrania sú pre ľudí menej prirodzené a menej rýchle ako hlas.

Systémy rozpoznávania hlasu budú mať v nasledujúcich rokoch hodnotu asi 10 miliárd dolárov, a preto sa veľké spoločnosti zameriavajú na rozvoj asistentov ako Apple Siri, Microsoft Cortana alebo Mycroft pre Linux, okrem toho, že sa stávajú čoraz populárnejšími a častejšími produktmi ako Amazon Echo, Google Home alebo Apple HomePod pre domácnosť, ako aj integrovaním sofistikovaných systémov rozpoznávania hlasu do pripojených automobilov.

To znamená, náš zoznam nástrojov na rozpoznávanie reči pre systém Linux Sú to:

Julius: je výkonný modul na nepretržité rozpoznávanie reči s množstvom slovnej zásoby.
DeepSpeech: je implementácia architektúry Baidu DeepSpeech TensorFLow.
Simon: pomerne flexibilný softvér na rozpoznávanie reči.
kaldi: je návrhová sada nástrojov pre C ++ pre výskum rozpoznávania reči.
CMUSfinga: v tomto prípade ide o mechanizmus rozpoznávania hlasu pre mobilné aplikácie a servery.
deepspeech.python: je implementácia DeepSPeech s Pythonom a pomocou Baidu Warp-CTC.

Zanechajte svoj komentár Zrušiť odpoveď

Miguel Angel dijo
hace 6 rokov

Veľmi dobré a bude nejaký dobrý TTS (prevod textu na reč) pre linux?

Vo Windows a Android sú veľmi kvalitné hlasy ako Loquendo, Ivona alebo NeoSpeech, ale nie sú pre Linux. Na Linuxe som vyskúšal hlasy mbrola a picoTTS, ale sú veľmi robotické.

Cepstral ponúka bezplatný hlas Alejandra pre linux, čo je celkom dobré, ale nevedel som, ako ho nainštalovať.

Odpovedať Miguelovi Angelovi
1. RAUL dijo
  hace 6 rokov
  
  Kráčam rovnako, ak máte dobrý podiel
  
  Odpovedať rAUL
  1. Armando dijo
    hace 6 rokov
    
    Na linuxe môžete použiť loquendo s vínom. Odporúčam toto video ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    Odpovedať Armandovi
Nasher_87 (ARG) dijo
hace 6 rokov

Pokúsil som sa nainštalovať asistenta, teda Google Assistant a nemohol som, zostal som v časti súboru registra, myslím, že sa volá. Škoda, že Alexa je svinstvo ...

Odpovedať Nasher_87 (ARG)
Gerardo dijo
hace 6 rokov

Program espeak pracuje na konzole espeak debian apt install. A pripojte sa napríklad espeak -ves «Hello World»

the -ves je v = hlasy sú = španielčina

Máte veľa možností, ako prečítať textový súbor, zapísať výsledok do súboru wav.

pozdravy

Odpoveď Gerardovi
rieka dijo
hace 6 rokov

pravda je veľmi zlá, okná, ktoré sú iným svetom ... tu zaostávajú o 10 rokov

Odpovedať raul
1. raul dijo
  hace 2 rokov
  
  A o 3 roky neskôr áno! toto je ešte po termíne.
  
  Odpovedajte Raúlovi