La veu és cada vegada un mètode més usat per interactuar amb els nostres dispositius, a més de ser l'únic mètode per a aquelles persones que necessiten d'aquest tipus de mètodes d'accessibilitat. En qualsevol cas, resulta bastant còmode parlar per dictar text o simplement introduir ordres de veu en els nostres sistemes perquè aquests facin algun tipus d'operació sense necessitat d'usar les mans. El problema és que els sistemes de reconeixement de veu es basen en motors que fan servir algoritmes matemàtics per reconèixer la veu i no són 100% fiables.
Els avenços tecnològics cada vegada s'acosten més la fiabilitat a la perfecció, i els sistemes d'intel·ligència artificial i big data també estan ajudant molt al fet que els programes de reconeixement de veu millorin enormement. Últimament s'estan posant molts esforços per millorar aquests sistemes a l'màxim, i molts estudis s'estan centrant en això per millorar el control i que siguin la interfície de el futur. Tingues en comte que les actuals interfícies són menys naturals per a les persones i menys ràpides que la veu.
Els sistemes de reconeixement de veu tindran un valor d'uns 10 mil milions de dòlars en els propers anys i per això les grans empreses s'estan centrant en el desenvolupament d'assistents com Siri d'Apple, Cortana de Microsoft o Mycroft per a Linux, A més de fer-se cada vegada més populars i freqüents els productes com Amazon Tiro, Google Home, o Apple HomePod per a la llar, així com integrar sofisticats sistemes de reconeixement de veu en els cotxes conetados.
Dit això, llistat de tools de reconeixement de veu per a Linux són:
- Julius: És un potent motor de reconeixement de veu continu amb gran quantitat de vocabulari.
- DeepSpeech: És una implementació de TensorFLow de la arqutiectura DeepSpeech de Baidu.
- Simon: Un programari de reconeixement de veu bastant flexible.
- Kaldi: És un kit d'eines C ++ de disseny per a investigació d'el reconeixement de veu.
- CMUSphinx: En aquest cas es tracta d'un motor de reconeixement de veu per a apps mòbils i servidors.
- deepspeech.python: És una implementació de DeepSPeech amb Python i usant Baidu Warp-CTC.
Molt bo, ¿i hi haurà algun TTS (text a veu) bo per a linux?
Al Windows i Android hi ha veus de molt bona qualitat com Loquendo, Ivona o NeoSpeech, però no estan per a Linux. A Linux vaig provar la veus mbrola i picoTTS però són molt robòtiques.
Cepstral ofereix gratis una veu d'Alejandra per linux que és bastant bona, però no vaig saber instal·lar-la.
jo camino en el mateix si aconsegueixes una bona comparteix
Podeu fer servir loquendo amb wine a linux. Et recomano aquest vídeo ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Jo intenti instal·lar un assistent, o sigui, Google Assistant i no vaig poder, em quedi a la part de l'arxiu de registre, crec que es diu. Llàstima que Alexa sigui una porqueria ...
El programa espeak funciona a la consola debian apt install espeak. I s'uneixi per exemple espeak -Veus «Hola Món»
el -Veus és v = voices és = espanyol
Té moltes opcions llegir un arxiu de text, gravar el resultat a un arxiu wav.
Salutacions
la veritat tot molt dolent, windows això és un altre món ... aca estan 10 anys endarrerits
I 3 anys després, si! això segueix endarrerit.