Glas se sve više koristi za interakciju s našim uređajima, uz to što je jedini način za one koji trebaju ovu vrstu metoda pristupačnosti. U svakom slučaju, prilično je ugodno govoriti kako bi se diktirao tekst ili jednostavno unositi glasovne naredbe u naše sisteme kako bi izvršili neku vrstu operacije bez upotrebe ruku. Problem je u tome prepoznavanje glasa zasnivaju se na mehanizmima koji koriste matematičke algoritme za prepoznavanje govora i nisu 100% pouzdani.
Tehnološki napredak sve više donosi pouzdanost do savršenstva, a umjetna inteligencija i sistemi velikih podataka također uvelike pomažu u poboljšanju programa prepoznavanja govora. U posljednje vrijeme ulažu se mnogi napori da se ovi sistemi maksimalno poboljšaju, a mnoge studije se usredotočuju na to kako bi poboljšale kontrolu i postale sučelje budućnosti. Imajte na umu da su trenutna sučelja manje prirodna za ljude i manje brza od glasa.
Sistemi za prepoznavanje glasa imat će vrijednost oko 10 milijardi dolara u narednim godinama i zato se velike kompanije usredotočuju na razvoj pomoćnika poput Appleove Siri, Microsoftove Cortane ili Mycroft za Linux, uz to što postaju sve popularniji i češći proizvodi poput Amazon Echo, Google Home ili Apple HomePod za dom, kao i integrirajući sofisticirane sisteme za prepoznavanje glasa u povezane automobile.
To je rekao, naša lista alata za prepoznavanje govora za Linux To su:
- Julius: moćan je mehanizam za kontinuirano prepoznavanje govora s puno rječnika.
- DeepSpeech: je TensorFLow implementacija Baidu-ove DeepSpeech arhitekture.
- Simon: prilično fleksibilan softver za prepoznavanje govora.
- kaldi: je C ++ dizajn alata za istraživanje prepoznavanja govora.
- CMUSphinx: u ovom slučaju to je mehanizam za prepoznavanje glasa za mobilne aplikacije i servere.
- deepspeech.python: je implementacija DeepSPeech-a s Pythonom i koristeći Baidu Warp-CTC.
Vrlo dobro, i hoće li postojati neki dobar TTS (pretvaranje teksta u govor) za linux?
U sustavima Windows i Android postoje vrlo kvalitetni glasovi kao što su Loquendo, Ivona ili NeoSpeech, ali oni nisu za Linux. Na Linuxu sam isprobao glasove mbrola i picoTTS, ali oni su vrlo robotski.
Cepstral nudi besplatni Alejandrin glas za linux, što je prilično dobro, ali nisam znao kako da ga instaliram.
I ja hodam istim ako dobijete dobar udio
Loquendo možete koristiti s vinom na linuxu. Preporučujem ovaj video ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Pokušao sam instalirati pomoćnika, mislim, Google Asistent i nisam mogao, ostao sam u dijelu datoteke registra, mislim da se zove. Šteta što je Alexa sranje ...
Program espeak radi na debian apt install konzoli espeak. I pridružite se na primjer espeak -ves «Hello World»
-ves je v = glasovi su = španski
Imate mnogo opcija za čitanje tekstualne datoteke, zapisivanje rezultata u wav datoteku.
Saludos
istina je vrlo loša, prozori to je drugi svijet ... evo zaostali su 10 godina
I 3 godine kasnije, da! ovo još uvijek kasni.