Ang boses ay lalong ginagamit upang makipag-ugnay sa aming mga aparato, bilang karagdagan sa pagiging nag-iisang pamamaraan para sa mga nangangailangan ng ganitong uri ng mga pamamaraan sa kakayahang mai-access. Sa anumang kaso, ito ay lubos na komportable na magsalita upang idikta ang teksto o ipasok lamang ang mga utos ng boses sa aming mga system upang gumawa sila ng isang uri ng operasyon nang hindi ginagamit ang kanilang mga kamay. Ang problema nun pagkilala sa pagsasalita ang mga ito ay batay sa mga makina na gumagamit ng mga matematika algorithm upang makilala ang pagsasalita at hindi 100% maaasahan.
Teknikal na pagsulong ay lalong nagdadala ng pagiging maaasahan sa pagiging perpekto, at ang artipisyal na katalinuhan at malalaking mga system ng data ay tumutulong din ng malaki upang mapabuti ang mga programa sa pagkilala sa pagsasalita nang labis. Kamakailan lamang maraming mga pagsisikap ang inilalagay upang mapagbuti ang mga sistemang ito sa maximum, at maraming mga pag-aaral ang nakatuon dito upang mapabuti ang kontrol at gawin silang interface ng hinaharap. Tandaan na ang mga kasalukuyang interface ay hindi gaanong natural para sa mga tao at mas mabilis kaysa sa boses.
Ang mga sistema ng pagkilala sa boses ay magkakaroon ng halaga na humigit-kumulang 10 bilyong dolyar sa mga darating na taon at iyon ang dahilan kung bakit ang mga malalaking kumpanya ay nakatuon sa pagbuo ng mga katulong tulad ng Siri ng Apple, Cortana ng Microsoft o Mycroft para sa Linux, bilang karagdagan sa pagiging unting tanyag at madalas na mga produkto tulad ng Amazon Echo, Google Home, o Apple HomePod para sa bahay, pati na rin ang pagsasama ng mga sopistikadong system ng pagkilala sa boses sa mga konektadong kotse.
Na sinabi, ang aming listahan ng mga tool sa pagkilala sa pagsasalita para sa Linux tunog:
- Julius: ay isang malakas na tuluy-tuloy na makina ng pagkilala sa pagsasalita na may maraming bokabularyo.
- DeepSpeech: ay isang pagpapatupad ng TensorFLow ng arkitekturang DeepSpeech ng Baidu.
- Simon: isang medyo nababaluktot na software ng pagkilala sa pagsasalita.
- kaldi: ay isang toolkit ng disenyo ng C ++ para sa pananaliksik sa pagkilala sa pagsasalita.
- CMUSphinx: sa kasong ito ito ay isang engine ng pagkilala sa boses para sa mga mobile app at server.
- deepspeech.python: ay isang pagpapatupad ng DeepSPeech kasama ang Python at paggamit ng Baidu Warp-CTC.
Napakahusay, at magkakaroon ba ng anumang magagandang TTS (teksto sa pagsasalita) para sa linux?
Sa Windows at Android mayroong napakahusay na mga tinig ng kalidad tulad ng Loquendo, Ivona o NeoSpeech, ngunit hindi sila para sa Linux. Sa Linux sinubukan ko ang mbrola at mga picoTTS na boses ngunit ang mga ito ay napaka robotic.
Nag-aalok ang Cepstral ng isang libreng boses ng Alejandra para sa linux na medyo mabuti, ngunit hindi ko alam kung paano ito i-install.
Pareho ang lakad ko kung nakakakuha ka ng magandang pagbabahagi
Maaari mong gamitin ang loquendo na may alak sa linux. Inirerekumenda ko ang video na ito ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Sinubukan kong mag-install ng isang katulong, ibig sabihin, Google Assistant at hindi ko magawa, nanatili ako sa bahagi ng registry file, sa palagay ko ito ay tinawag. Napakasamang si Alexa ay basura ...
Gumagana ang programa ng espeak sa debian apt na mag-install ng espeak console. At sumali halimbawa speak -ves «Hello World»
ang -ves ay v = tinig ay = Espanyol
Mayroon kang maraming mga pagpipilian upang basahin ang isang text file, isulat ang resulta sa isang wav file.
Regards
ang totoo ay napakasama, ang mga bintana na ibang mundo ... narito ang 10 taon na sila
At makalipas ang 3 taon, oo! overdue pa ito.