Najlepšie nástroje na rozpoznávanie reči pre systém Linux

Pozadie rozpoznávania hlasu

Hlas je čoraz viac metódou používanou na interakciu s našimi zariadeniami a je jedinou metódou pre tých, ktorí tento typ prístupových metód potrebujú. V každom prípade je celkom pohodlné hovoriť tak, že diktujete text alebo jednoducho zadáte hlasové príkazy do našich systémov, aby mohli robiť nejaké operácie bez použitia rúk. Problém je v tom rozpoznávanie hlasu sú založené na motoroch, ktoré používajú matematické algoritmy na rozpoznávanie reči a nie sú stopercentne spoľahlivé.

Technologický pokrok čoraz viac prináša spoľahlivosť k dokonalosti a systémy umelej inteligencie a veľkých dát tiež veľmi pomáhajú pri enormnom vylepšovaní programov rozpoznávania reči. V poslednej dobe sa vynakladá veľa úsilia na zlepšenie týchto systémov na maximum a mnoho štúdií sa zameriava na to, aby sa zlepšila kontrola a vytvorili z nich rozhranie budúcnosti. Majte na pamäti, že súčasné rozhrania sú pre ľudí menej prirodzené a menej rýchle ako hlas.

Systémy rozpoznávania hlasu budú mať v nasledujúcich rokoch hodnotu asi 10 miliárd dolárov, a preto sa veľké spoločnosti zameriavajú na rozvoj asistentov ako Apple Siri, Microsoft Cortana alebo Mycroft pre Linux, okrem toho, že sa stávajú čoraz populárnejšími a častejšími produktmi ako Amazon Echo, Google Home alebo Apple HomePod pre domácnosť, ako aj integrovaním sofistikovaných systémov rozpoznávania hlasu do pripojených automobilov.

To znamená, náš zoznam nástrojov na rozpoznávanie reči pre systém Linux Sú to:

  • Julius: je výkonný modul na nepretržité rozpoznávanie reči s množstvom slovnej zásoby.
  • DeepSpeech: je implementácia architektúry Baidu DeepSpeech TensorFLow.
  • Simon: pomerne flexibilný softvér na rozpoznávanie reči.
  • kaldi: je návrhová sada nástrojov pre C ++ pre výskum rozpoznávania reči.
  • CMUSfinga: v tomto prípade ide o mechanizmus rozpoznávania hlasu pre mobilné aplikácie a servery.
  • deepspeech.python: je implementácia DeepSPeech s Pythonom a pomocou Baidu Warp-CTC.

Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Za údaje zodpovedá: AB Internet Networks 2008 SL
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.

  1.   Miguel Angel dijo

    Veľmi dobré a bude nejaký dobrý TTS (prevod textu na reč) pre linux?

    Vo Windows a Android sú veľmi kvalitné hlasy ako Loquendo, Ivona alebo NeoSpeech, ale nie sú pre Linux. Na Linuxe som vyskúšal hlasy mbrola a picoTTS, ale sú veľmi robotické.

    Cepstral ponúka bezplatný hlas Alejandra pre linux, čo je celkom dobré, ale nevedel som, ako ho nainštalovať.

    1.    RAUL dijo

      Kráčam rovnako, ak máte dobrý podiel

      1.    Armando dijo

        Na linuxe môžete použiť loquendo s vínom. Odporúčam toto video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Pokúsil som sa nainštalovať asistenta, teda Google Assistant a nemohol som, zostal som v časti súboru registra, myslím, že sa volá. Škoda, že Alexa je svinstvo ...

  3.   Gerardo dijo

    Program espeak pracuje na konzole espeak debian apt install. A pripojte sa napríklad espeak -ves «Hello World»

    the -ves je v = hlasy sú = španielčina

    Máte veľa možností, ako prečítať textový súbor, zapísať výsledok do súboru wav.

    pozdravy

  4.   rieka dijo

    pravda je veľmi zlá, okná, ktoré sú iným svetom ... tu zaostávajú o 10 rokov

    1.    raul dijo

      A o 3 roky neskôr áno! toto je ešte po termíne.