音声は、このタイプのアクセシビリティ方法を必要とする人々のための唯一の方法であることに加えて、ますます私たちのデバイスと対話するために使用される方法です。 いずれにせよ、テキストを口述するために話すこと、または単に音声コマンドをシステムに入力することは非常に快適であり、システムは手を使わずに何らかの操作を行うことができます。 問題はそれです 音声認識 それらは、数学的アルゴリズムを使用して音声を認識するエンジンに基づいており、100%信頼できるわけではありません。
技術の進歩はますます 信頼性 完全に、そして人工知能とビッグデータシステムも音声認識プログラムを大幅に改善するのに大いに役立っています。 最近、これらのシステムを最大限に改善するために多くの努力が払われており、多くの研究が、制御を改善し、それらを将来のインターフェースにするためにそれに焦点を合わせています。 現在のインターフェースは、人にとって自然ではなく、音声よりも高速ではないことに注意してください。
音声認識システムの価値は今後数年間で約10億ドルになるため、大企業はAppleのSiri、MicrosoftのCortana、 Linux用のMycroft、Amazon Echo、Google Home、Apple HomePodなどの家庭用のますます人気が高く頻繁な製品になることに加えて、コネクテッドカーに高度な音声認識システムを統合します。
それは言った、 Linux用の音声認識ツールのリスト 音:
- ジュリアス:多くの語彙を備えた強力な連続音声認識エンジンです。
- ディープスピーチ:は、BaiduのDeepSpeechアーキテクチャのTensorFLow実装です。
- サイモン:かなり柔軟な音声認識ソフトウェア。
- カルディ:は、音声認識研究用のC ++設計ツールキットです。
- CMUSフィンクス:この場合、モバイルアプリとサーバー用の音声認識エンジンです。
- deepspeech.python:Pythonを使用し、BaiduWarp-CTCを使用したDeepSPeechの実装です。
非常に優れています。Linux用の優れたTTS(テキスト読み上げ)はありますか?
WindowsとAndroidには、Loquendo、Ivona、NeoSpeechなどの非常に高品質の音声がありますが、Linux用ではありません。 Linuxでは、mbrolaとpicoTTSの音声を試しましたが、非常にロボット的です。
CepstralはLinux用の無料のAlejandraの音声を提供していますが、これは非常に優れていますが、インストール方法がわかりませんでした。
あなたが良いシェアを得るならば、私は同じように歩きます
Linuxではwineと一緒にloquendoを使用できます。 私はこのビデオをお勧めします...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
アシスタントをインストールしようとしましたが、Googleアシスタントをインストールできませんでした。レジストリファイルの一部にとどまり、呼び出されたと思います。 残念なAlexaはがらくたです...
espeakプログラムは、debian apt installespeakコンソールで動作します。 そして、例えばespeak-ves«HelloWorld»に参加してください
-vesはv =声は=スペイン語
テキストファイルを読み取り、結果をwavファイルに書き込むための多くのオプションがあります。
よろしく
真実はすべて非常に悪いです、別の世界である窓...ここで彼らは10年遅れています
そして3年後、そうです! これはまだ遅れています。