语音越来越成为一种与我们的设备进行交互的方法,它是需要此类可访问性方法的人们的唯一方法。 在任何情况下,都可以说出口授文字或简单地将语音命令输入到我们的系统中,这样他们无需用手即可进行某种操作。 问题是 语音识别 它们基于使用数学算法来识别语音的引擎,并且并非100%可靠。
技术的进步越来越多地带来了 可靠性 到完美,人工智能和大数据系统也极大地帮助改善了语音识别程序。 近来,人们进行了许多努力以最大程度地改善这些系统,并且许多研究都集中在其上,以改善控制并使其成为未来的接口。 请记住,当前的界面对人来说不那么自然,而且比语音的速度还差。
语音识别系统的价值将在未来几年内达到约10亿美元,这就是为什么大公司将重点放在开发诸如Apple的Siri,Microsoft的Cortana或 Mycroft Linux版,除了变得越来越受欢迎和频繁使用的产品(例如用于家庭的Amazon Echo,Google Home或Apple HomePod)之外,还将先进的语音识别系统集成到了联网汽车中。
那说, 我们针对Linux的语音识别工具列表 是:
- 朱利叶斯:是功能强大的连续语音识别引擎,具有大量词汇。
- 深度语音:是百度DeepSpeech架构的TensorFLow实现。
- 西蒙:一个相当灵活的语音识别软件。
- Kaldi:是用于语音识别研究的C ++设计工具包。
- ph鱼:在这种情况下,它是用于移动应用和服务器的语音识别引擎。
- deepspeech.python:是使用Python并使用百度Warp-CTC的DeepSPeech的实现。
7条评论,留下您的评论
很好,Linux是否会有好的TTS(文本到语音)?
在Windows和Android中,有质量很好的声音,例如Loquendo,Ivona或NeoSpeech,但它们不适用于Linux。 在Linux上,我尝试了mbrola和picoTTS语音,但是它们非常机器人化。
Cepstral为Linux提供了免费的Alejandra语音,这是相当不错的,但是我不知道如何安装。
如果你能得到很好的分享,我会走同样的路
您可以在Linux上将loquendo与wine一起使用。 我推荐这部影片...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
我试图安装一个助手,我的意思是说Google助手,但是我不能,我留在注册表文件中,我认为它叫做。 太糟糕了,Alexa真是可惜...
espeak程序可在debian apt install espeak控制台上运行。 并加入例如espeak -ves«Hello World»
-ves是v =声音是=西班牙语
您可以选择许多选项来读取文本文件,并将结果写入wav文件。
问候
事实是非常糟糕,窗户是另一个世界...在这里,他们落后了10年
3年后,是的! 这仍然是迟到的。