Nejlepší nástroje pro rozpoznávání řeči pro Linux

Pozadí rozpoznávání hlasu

Hlas se stále častěji používá k interakci s našimi zařízeními, navíc je jedinou metodou pro ty, kteří tento typ přístupových metod potřebují. V každém případě je docela pohodlné mluvit, abychom diktovali text nebo jednoduše zadali hlasové příkazy do našich systémů, aby mohli provádět nějakou operaci bez použití rukou. Problém je v tom rozpoznávání řeči jsou založeny na motorech, které používají matematické algoritmy k rozpoznávání řeči a nejsou stoprocentně spolehlivé.

Technologický pokrok stále více přináší spolehlivost k dokonalosti a systémy umělé inteligence a velkých dat také výrazně pomáhají při enormním vylepšování programů rozpoznávání řeči. V poslední době se vyvíjí mnoho snah o maximální zlepšení těchto systémů a mnoho studií se zaměřuje na to, aby se zlepšila kontrola a učinily z nich rozhraní budoucnosti. Mějte na paměti, že aktuální rozhraní jsou pro lidi méně přirozená a méně rychlá než hlas.

Systémy rozpoznávání hlasu budou mít v nadcházejících letech hodnotu asi 10 miliard dolarů, a proto se velké společnosti zaměřují na rozvoj asistentů, jako je Apple Siri, Microsoft Cortana nebo Mycroft pro Linux, kromě toho, že se stávají stále populárnějšími a častějšími produkty, jako jsou Amazon Echo, Google Home nebo Apple HomePod pro domácnost, a také integrací sofistikovaných systémů rozpoznávání hlasu do připojených automobilů.

To znamená, náš seznam nástrojů pro rozpoznávání řeči pro Linux Zvuk:

  • Julius: je výkonný modul pro nepřetržité rozpoznávání řeči se spoustou slovní zásoby.
  • DeepSpeech: je implementace TensorFLow architektury Baidu DeepSpeech.
  • Simon: poměrně flexibilní software pro rozpoznávání řeči.
  • kaldi: je sada nástrojů pro návrh C ++ pro výzkum rozpoznávání řeči.
  • CMUSfinga: v tomto případě se jedná o modul rozpoznávání hlasu pro mobilní aplikace a servery.
  • deepspeech.python: je implementace DeepSPeech s Pythonem a pomocí Baidu Warp-CTC.

Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.

      Miguel Angel řekl

    Velmi dobré a bude pro Linux nějaký dobrý TTS (převod textu na řeč)?

    Ve Windows a Android jsou velmi kvalitní hlasy jako Loquendo, Ivona nebo NeoSpeech, ale nejsou pro Linux. Na Linuxu jsem vyzkoušel hlasy mbrola a picoTTS, ale jsou velmi robotické.

    Cepstral nabízí zdarma hlas Alejandry pro linux, což je docela dobré, ale nevěděl jsem, jak jej nainstalovat.

         RAUL řekl

      Chodím stejně, pokud máte dobrý podíl

           Armando řekl

        Na linuxu můžete použít loquendo s vínem. Doporučuji toto video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

      Nasher_87 (ARG) řekl

    Snažil jsem se nainstalovat asistenta, myslím, Google Assistant a nemohl jsem, zůstal jsem v části souboru registru, myslím, že se jmenuje. Škoda, že Alexa je kecy ...

      Gerardo řekl

    Program espeak pracuje na konzole espeak debian apt install. A připojte se například espeak -ves «Hello World»

    -ves je v = hlasy jsou = španělština

    Máte mnoho možností, jak číst textový soubor, zapsat výsledek do souboru wav.

    pozdravy

      Raul řekl

    pravda je velmi špatná, okna, to je jiný svět ... tady jsou o 10 let pozadu

         Raul řekl

      A o 3 roky později ano! to je ještě po splatnosti.