适用于Linux的最佳语音识别工具

语音识别背景

语音越来越成为一种与我们的设备进行交互的方法,它是需要此类可访问性方法的人们的唯一方法。 在任何情况下,都可以说出口授文字或简单地将语音命令输入到我们的系统中,这样他们无需用手即可进行某种操作。 问题是 语音识别 它们基于使用数学算法来识别语音的引擎,并且并非100%可靠。

技术的进步越来越多地带来了 可靠性 到完美,人工智能和大数据系统也极大地帮助改善了语音识别程序。 近来,人们进行了许多努力以最大程度地改善这些系统,并且许多研究都集中在其上,以改善控制并使其成为未来的接口。 请记住,当前的界面对人来说不那么自然,而且比语音的速度还差。

语音识别系统的价值将在未来几年内达到约10亿美元,这就是为什么大公司将重点放在开发诸如Apple的Siri,Microsoft的Cortana或 Mycroft Linux版,除了变得越来越受欢迎和频繁使用的产品(例如用于家庭的Amazon Echo,Google Home或Apple HomePod)之外,还将先进的语音识别系统集成到了联网汽车中。

那说, 我们针对Linux的语音识别工具列表 是:

  • 朱利叶斯:是功能强大的连续语音识别引擎,具有大量词汇。
  • 深度语音:是百度DeepSpeech架构的TensorFLow实现。
  • 西蒙:一个相当灵活的语音识别软件。
  • Kaldi:是用于语音识别研究的C ++设计工具包。
  • ph鱼:在这种情况下,它是用于移动应用和服务器的语音识别引擎。
  • deepspeech.py​​thon:是使用Python并使用百度Warp-CTC的DeepSPeech的实现。

7条评论,留下您的评论

发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   米格尔·安赫尔

    很好,Linux是否会有好的TTS(文本到语音)?

    在Windows和Android中,有质量很好的声音,例如Loquendo,Ivona或NeoSpeech,但它们不适用于Linux。 在Linux上,我尝试了mbrola和picoTTS语音,但是它们非常机器人化。

    Cepstral为Linux提供了免费的Alejandra语音,这是相当不错的,但是我不知道如何安装。

    1.    劳尔

      如果你能得到很好的分享,我会走同样的路

      1.    Armando

        您可以在Linux上将loquendo与wine一起使用。 我推荐这部影片...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87(ARG)

    我试图安装一个助手,我的意思是说Google助手,但是我不能,我留在注册表文件中,我认为它叫做。 太糟糕了,Alexa真是可惜...

  3.   赫拉尔

    espeak程序可在debian apt install espeak控制台上运行。 并加入例如espeak -ves«Hello World»

    -ves是v =声音是=西班牙语

    您可以选择许多选项来读取文本文件,并将结果写入wav文件。

    问候

  4.  

    事实是非常糟糕,窗户是另一个世界...在这里,他们落后了10年

    1.    劳尔

      3年后,是的! 这仍然是迟到的。