最近 オープン音声合成システムの新バージョン RHVoice 1.6.0 の発売が発表されました。 これは当初、ロシア語に高品質のサポートを提供するために開発されましたが、後に英語、ポルトガル語、ウクライナ語、キルギス語、タタール語、グルジア語などの他の言語にも適応されました。
RHVoice について知らない人のために言っておきますが、このプロジェクトは HTS プロジェクトの開発を使用 (HMM/DNNをベースとした音声合成システム) 統計モデルを使用したパラメトリック合成手法 (HMM ベースの統計的パラメトリック合成 – 隠れマルコフ モデル)。
統計モデルの利点は、オーバーヘッド コストが低く、CPU 電力需要が低いことです。 すべての操作はユーザーのシステム上でローカルに実行されます。 XNUMX つのレベルの音声品質がサポートされています (品質が低いほど、パフォーマンスは向上し、応答時間は短くなります)。
統計モデルの欠点は、発音の品質が比較的低いことであり、自然な音声断片の組み合わせから音声を生成するシンセサイザーのレベルには達しませんが、それでも結果は非常に読みやすく、スピーカーからのブロードキャストに似ています。 比較のために、機械学習テクノロジーとロシア語のモデルのセットに基づく音声合成用のオープン エンジンを提供する Silero プロジェクトは、RHVoice よりも品質が優れています。
ロシア語には 13 の音声が利用可能で、音声は自然音声録音に基づいて形成されています。。 設定では、速度、ピッチ、音量を変更できます。
Sonicライブラリを使用してテンポを変更できます。 入力テキストの分析に基づいて言語を自動的に検出し、変更することができます (たとえば、別の言語の単語や引用符については、特定の言語のネイティブ合成モデルを使用できます)。 さまざまな言語の音声の組み合わせを定義する音声プロファイルがサポートされています。
コードは C++ で書かれており、システムは GNU/Linux、Windows、Android でサポートされていることに加えて、LGPL 2.1 ライセンスの下で配布されています。 このプログラムは、テキストを音声に変換するための典型的な TTS (テキスト読み上げ) インターフェイス、SAPI5 (Windows)、Speech Dispatcher (GNU/Linux)、および Android Text-To-Speech API と互換性がありますが、 NVDA画面。
RHVoice 1.6.0の主な新機能
この新しいバージョンのシステムで、目立つ主な新しさは次のとおりです。 ロシア語を話すための 5 つの新しい音声が追加されました。 さらに、アルバニア語のサポートが実装されました。
この新しいバージョンで目立った変更点のもう XNUMX つは次のとおりです。 辞書がウクライナ語用に更新されました そしてそのサポートは絵文字を表現するために拡張されました。
また、Android プラットフォームのアプリケーションのエラーを修正するために行われた、 カスタム辞書のインポートが簡素化され、Android 11 プラットフォームのサポートが追加されました。
一方で、g2p.case、word_break、イコライゼーション フィルターとの互換性など、新しい構成と機能がエンジンのコアに追加されていることもわかります。
最後に、この新しいバージョンについて詳しく知りたい場合は、詳細を参照してください。 次のリンクで。
RHVoiceをダウンロード
のために興味のある方はこのシステムをダウンロードしてください 音声合成の場合、インストール パッケージは次の場所から入手できます。 次のリンク。
この新バージョンの発表でも次のように述べられています。 アンドロイドユーザー向け RHVoice がすでにデバイスにインストールされている、 自動的に更新されます 自動更新が有効になっている場合は、プロセスを手動で実行する必要はありません。
アップデートが無効になっており、新しいバージョンが必要な場合は、手動でアップデートを確認する機能を有効にすることができます。
更新された RHVoice が再度実行されるとすぐに、新しい言語データのダウンロードが試行されます。 新しいデータがダウンロードされると、RHVoice はそのデータの使用を開始します。