Vocea este din ce în ce mai multă metodă utilizată pentru a interacționa cu dispozitivele noastre, pe lângă faptul că este singura metodă pentru cei care au nevoie de acest tip de metode de accesibilitate. În orice caz, este destul de confortabil să vorbiți pentru a dicta text sau pur și simplu să introduceți comenzi vocale în sistemele noastre, astfel încât acestea să facă un fel de operație fără a-și folosi mâinile. Problema este că recunoașterea vorbirii se bazează pe motoare care utilizează algoritmi matematici pentru a recunoaște vorbirea și nu sunt 100% fiabile.
Progresele tehnologice aduc din ce în ce mai mult fiabilitate la perfecțiune, iar inteligența artificială și sistemele de date mari ajută, de asemenea, mult la îmbunătățirea enormă a programelor de recunoaștere a vorbirii. În ultima perioadă se depun multe eforturi pentru a îmbunătăți la maximum aceste sisteme și multe studii se concentrează asupra acestuia pentru a îmbunătăți controlul și a le face interfața viitorului. Rețineți că interfețele actuale sunt mai puțin naturale pentru oameni și mai puțin rapide decât vocea.
Sistemele de recunoaștere vocală vor avea o valoare de aproximativ 10 miliarde de dolari în următorii ani și de aceea companiile mari se concentrează pe dezvoltarea asistenților precum Apple Siri, Microsoft Cortana sau Mycroft pentru Linux, pe lângă faptul că devin produse din ce în ce mai populare și frecvente precum Amazon Echo, Google Home sau Apple HomePod pentru casă, precum și integrarea sistemelor sofisticate de recunoaștere a vocii în mașinile conectate.
Acestea fiind spuse, lista noastră de instrumente de recunoaștere a vorbirii pentru Linux sunet:
- Julius: este un puternic motor continuu de recunoaștere a vorbirii, cu mult vocabular.
- Deep Speech: este o implementare TensorFLow a arhitecturii DeepSpeech a lui Baidu.
- Simon: un software destul de flexibil de recunoaștere a vorbirii.
- caldi: este un set de instrumente de proiectare C ++ pentru cercetarea recunoașterii vorbirii.
- CMUSphinx: în acest caz este un motor de recunoaștere vocală pentru aplicații și servere mobile.
- deepspeech.python: este o implementare a DeepSPeech cu Python și folosind Baidu Warp-CTC.
Foarte bine și va exista vreun TTS bun (text to speech) pentru Linux?
În Windows și Android există voci de foarte bună calitate, precum Loquendo, Ivona sau NeoSpeech, dar nu sunt pentru Linux. Pe Linux am încercat vocile mbrola și picoTTS, dar sunt foarte robotizate.
Cepstral oferă o voce Alejandra gratuită pentru Linux, care este destul de bună, dar nu știam cum să o instalez.
Merg la fel dacă primești o cotă bună
Puteți folosi loquendo cu vin pe Linux. Recomand acest videoclip ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Am încercat să instalez un asistent, adică Google Assistant și nu am putut, am rămas în partea din fișierul de registru, cred că se numește. Păcat că Alexa este o porcărie ...
Programul espeak funcționează pe consola debeak apt install espeak. Și alăturați-vă de exemplu speak -ves «Hello World»
-ves este v = voci este = spaniolă
Aveți multe opțiuni pentru a citi un fișier text, a scrie rezultatul într-un fișier WAV.
În ceea ce priveşte
adevărul este foarte rău, ferestrele care sunt o altă lume ... aici sunt cu 10 ani în urmă
Și 3 ani mai târziu, da! acest lucru este încă întârziat.