Najbolji alati za prepoznavanje govora za Linux

Pozadina prepoznavanja glasa

Glas se sve više koristi za interakciju s našim uređajima, uz to što je jedini način za one koji trebaju ovu vrstu metoda pristupačnosti. U svakom slučaju, prilično je ugodno govoriti kako bi se diktirao tekst ili jednostavno unositi glasovne naredbe u naše sisteme kako bi izvršili neku vrstu operacije bez upotrebe ruku. Problem je u tome prepoznavanje glasa zasnivaju se na mehanizmima koji koriste matematičke algoritme za prepoznavanje govora i nisu 100% pouzdani.

Tehnološki napredak sve više donosi pouzdanost do savršenstva, a umjetna inteligencija i sistemi velikih podataka također uvelike pomažu u poboljšanju programa prepoznavanja govora. U posljednje vrijeme ulažu se mnogi napori da se ovi sistemi maksimalno poboljšaju, a mnoge studije se usredotočuju na to kako bi poboljšale kontrolu i postale sučelje budućnosti. Imajte na umu da su trenutna sučelja manje prirodna za ljude i manje brza od glasa.

Sistemi za prepoznavanje glasa imat će vrijednost oko 10 milijardi dolara u narednim godinama i zato se velike kompanije usredotočuju na razvoj pomoćnika poput Appleove Siri, Microsoftove Cortane ili Mycroft za Linux, uz to što postaju sve popularniji i češći proizvodi poput Amazon Echo, Google Home ili Apple HomePod za dom, kao i integrirajući sofisticirane sisteme za prepoznavanje glasa u povezane automobile.

To je rekao, naša lista alata za prepoznavanje govora za Linux To su:

  • Julius: moćan je mehanizam za kontinuirano prepoznavanje govora s puno rječnika.
  • DeepSpeech: je TensorFLow implementacija Baidu-ove DeepSpeech arhitekture.
  • Simon: prilično fleksibilan softver za prepoznavanje govora.
  • kaldi: je C ++ dizajn alata za istraživanje prepoznavanja govora.
  • CMUSphinx: u ovom slučaju to je mehanizam za prepoznavanje glasa za mobilne aplikacije i servere.
  • deepspeech.python: je implementacija DeepSPeech-a s Pythonom i koristeći Baidu Warp-CTC.

Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Odgovoran za podatke: AB Internet Networks 2008 SL
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.

  1.   Miguel Angel rekao je

    Vrlo dobro, i hoće li postojati neki dobar TTS (pretvaranje teksta u govor) za linux?

    U sustavima Windows i Android postoje vrlo kvalitetni glasovi kao što su Loquendo, Ivona ili NeoSpeech, ali oni nisu za Linux. Na Linuxu sam isprobao glasove mbrola i picoTTS, ali oni su vrlo robotski.

    Cepstral nudi besplatni Alejandrin glas za linux, što je prilično dobro, ali nisam znao kako da ga instaliram.

    1.    RAUL rekao je

      I ja hodam istim ako dobijete dobar udio

      1.    Armando rekao je

        Loquendo možete koristiti s vinom na linuxu. Preporučujem ovaj video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) rekao je

    Pokušao sam instalirati pomoćnika, mislim, Google Asistent i nisam mogao, ostao sam u dijelu datoteke registra, mislim da se zove. Šteta što je Alexa sranje ...

  3.   Gerardo rekao je

    Program espeak radi na debian apt install konzoli espeak. I pridružite se na primjer espeak -ves «Hello World»

    -ves je v = glasovi su = španski

    Imate mnogo opcija za čitanje tekstualne datoteke, zapisivanje rezultata u wav datoteku.

    Saludos

  4.   raul rekao je

    istina je vrlo loša, prozori to je drugi svijet ... evo zaostali su 10 godina

    1.    Raul rekao je

      I 3 godine kasnije, da! ovo još uvijek kasni.