Mozilla Common Voice 7.0には、13,000時間以上の音声データが含まれています

最近 NVIDIAとMozillaは、「Mozilla CommonVoice7.0」の新バージョンのリリースを発表しました これは、集合的な起源の13.000時間以上の音声データと、さらに16の言語の追加を表しています。 前回の更新と比較して、のサイズ 材料量 コレクションで話す ほぼ50%増加しています。

さらに、 サポートされている言語の数が60から76に増えました、ベラルーシ語、カザフ語、ウズベク語、ブルガリア語、アルメニア語、アゼルバイジャン語、バシキール語の追加サポートを初めて含みます。

Common Voiceに慣れていない人は、eこれはオープンデータの音声データセットです 世界最大であり、音声技術を民主化するように設計されています。 研究者、学者、開発者によって使用されます 世界中で。

従業員は自分のコミュニティを動員して音声データを寄付します MCVの公開データベースにアクセスします。このデータベースを使用して、音声対応テクノロジーをトレーニングできます。 NVIDIAコラボレーションの一環としてcMozilla Common Voiceで、 この公開データセットおよびその他の公開データセットでトレーニングされたモデルは無料で利用できます NVIDIANeMoと呼ばれるオープンソースツールキットを介して。

プロジェクト 音声テンプレートのデータベースを蓄積するための共同作業を整理することを目的としています、さまざまな声や話し方をすべて考慮に入れます。 人間の発話に典型的なフレーズのさまざまな発音の記録を含む蓄積されたデータベースは、機械学習システムや研究プロジェクトで制限なく使用できます。

Vosk連続音声認識ライブラリの作成者によると、Common Voiceセットの欠点は、音声素材の一方的なものです(20代と30代の男性の優位性と、女性、子供たちの声の素材の欠如です。および高齢者)、語彙の変動性の欠如(同じフレーズの繰り返し)および歪みが発生しやすいMP3録音の分布。

Common Voice7.0の新バージョンについて

この新しいバージョンでは 75人以上が参加しました 英語の資料の作成において、2637時間の確認されたスピーチを指示しました(66万1686千人の参加者とXNUMX時間でした)。

また、冒頭で述べたように、 この新しいバージョンでは、16の新しい言語が導入されています 合計76の言語のCommonVoiceデータセットに入力します。そのうち、合計時間で上位2.630つの言語は、英語(2.260時間)、ルワンダ語(1.040)、ドイツ語(920)、カタロニア語(840)、エスペラント語(XNUMX)です。

割合が最も増加している言語はタイ語です (ほぼ20倍の成長、12時間から250時間)、ルガンダ語(9倍の成長、8時間から80時間)、 エスペラント (7時間から100時間までの840倍以上の成長) とタミル語 (8時間から24時間までの220倍以上の成長)。 不思議なことに、 ルワンダは累積データでXNUMX番目にランクされています、2260時間が収集されました。 続いて、ドイツ語(1040)、カタロニア語(920)、エスペラント語(840)が続きます。 データセットには現在、182,000を超える独自の声が含まれており、納税者コミュニティはわずか25か月でXNUMX%成長しています。

プロジェクトへの参加の一環として、 NVIDIAは、機械学習システム用にすぐに使用できるトレーニング済みモデルを用意しています 収集されたデータに基づく(PyTorchと互換性があります)。 モデルは、無料でオープンなNVIDIA NeMoツールの一部として配布されます。このツールは、たとえば、MTSやSberbankの自動音声サービスですでに使用されています。

モデルは 自然言語での音声認識、音声合成、情報処理システムを目的としています また、音声対話システム、音声文字変換プラットフォーム、自動コールセンターの設計の研究者にも役立ちます。 以前に利用可能なプロジェクトとは異なり、公開されたモデルは英語の認識に限定されず、さまざまな言語、アクセント、およびスピーチの形式をカバーします。

最後に あなたがそれについてもっと知りたいなら、詳細はで確認できます 次のリンク。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。