適用於Linux的最佳語音識別工具

語音識別背景

語音越來越成為一種與我們的設備進行交互的方法,它是需要此類可訪問性方法的人們的唯一方法。 在任何情況下,都可以說出口授文字或簡單地將語音命令輸入到我們的系統中,這樣他們就可以不用手就可以進行某種操作。 問題是 語音識別 它們基於使用數學算法來識別語音的引擎,並且並非100%可靠。

技術的進步越來越多地帶來了 可靠性 到完美,人工智能和大數據系統也極大地幫助改善了語音識別程序。 近來,人們進行了​​許多努力以最大程度地改善這些系統,並且許多研究都集中在其上,以改善控制並使其成為未來的接口。 請記住,當前的界面對人來說不那麼自然,而且比語音的速度還差。

語音識別系統的價值將在未來幾年內達到約10億美元,這就是為什麼大型公司將重點發展諸如Apple的Siri,Microsoft的Cortana或 Mycroft Linux版,除了變得越來越受歡迎和頻繁使用的產品(例如家庭用的Amazon Echo,Google Home或Apple HomePod)之外,還將先進的語音識別系統集成到了聯網汽車中。

那說, 我們針對Linux的語音識別工具列表 聲音:

  • 朱利葉斯:是功能強大的連續語音識別引擎,具有大量詞彙。
  • 深度語音:是百度DeepSpeech架構的TensorFLow實現。
  • 西蒙:一個相當靈活的語音識別軟件。
  • 卡爾迪:是用於語音識別研究的C ++設計工具包。
  • ph魚:在這種情況下,它是用於移動應用和服務器的語音識別引擎。
  • deepspeech.py​​thon:是使用Python並使用百度Warp-CTC的DeepSPeech的實現。

發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責資料:AB Internet Networks 2008 SL
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。

  1.   米格爾·安赫爾 他說:

    很好,Linux是否會有好的TTS(文本到語音)?

    在Windows和Android中,有質量很好的聲音,例如Loquendo,Ivona或NeoSpeech,但它們不適用於Linux。 在Linux上,我嘗試了mbrola和picoTTS語音,但是它們非常機器人化。

    Cepstral為Linux提供了免費的Alejandra語音,這相當不錯,但我不知道如何安裝。

    1.    勞爾 他說:

      如果你能得到很好的分享,我會走同樣的路

      1.    阿爾曼多 他說:

        您可以在Linux上將loquendo與wine一起使用。 我推薦這部影片...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87(ARG) 他說:

    我試圖安裝一個助手,我的意思是說Google助手,但是我不能,我留在註冊表文件中,我認為它叫做。 太糟糕了,Alexa真是可惜...

  3.   赫拉爾多 他說:

    espeak程序可在debian apt install espeak控制台上運行。 並加入例如espeak -ves«Hello World»

    -ves是v =聲音是=西班牙語

    您可以選擇許多選項來讀取文本文件,並將結果寫入wav文件。

    問候

  4.   勞爾 他說:

    事實是非常糟糕,窗戶是另一個世界...在這裡,他們落後了10年

    1.    勞爾 他說:

      3年後,是的! 這仍然是遲到的。