Mozilla Common Voice 7.0은 13,000시간 이상의 음성 데이터와 함께 제공됩니다.

최근에 NVIDIA와 Mozilla는 "Mozilla Common Voice 7.0"의 새 버전 출시를 발표했습니다. 이는 13.000시간 이상의 집단적 기원의 음성 데이터와 다른 16개 언어의 추가를 나타냅니다. 지난 업데이트에 비해, 크기 재료 볼륨 컬렉션에서 말하기 거의 50% 이상 증가했습니다.

또한, 지원되는 언어의 수가 60개에서 76개로 증가했습니다., 처음으로 벨로루시어, 카자흐어, 우즈벡어, 불가리아어, 아르메니아어, 아제르바이잔어 및 바쉬키르어에 대한 추가 지원을 포함합니다.

Common Voice에 익숙하지 않은 사람들은 e이것은 개방형 데이터 음성 데이터 세트입니다. 세계에서 가장 크고 음성 기술의 민주화를 위해 설계되었습니다. 연구원, 학자 및 개발자가 사용합니다. 세계.

직원들은 자신의 커뮤니티를 동원하여 음성 데이터를 기부합니다. 누구나 음성 지원 기술을 교육하는 데 사용할 수 있는 MCV의 공개 데이터베이스에 저장합니다. NVIDIA 협업의 일환으로 c모질라 커먼 보이스에서, 이 데이터 세트와 다른 공개 데이터 세트에서 훈련된 모델을 무료로 사용할 수 있습니다. NVIDIA NeMo라는 오픈 소스 툴킷을 통해.

프로젝트 음성 템플릿 데이터베이스를 축적하기 위해 공동 작업을 조직하는 것을 목표로 합니다., 모든 다양한 목소리와 말하는 방식을 고려합니다. 인간의 말에서 흔히 볼 수 있는 다양한 어구의 발음을 녹음한 축적된 데이터베이스는 머신 러닝 시스템과 연구 프로젝트에서 제약 없이 사용할 수 있습니다.

Vosk 연속음성인식 라이브러리의 저자에 따르면 Common Voice 세트의 단점은 보컬 소재의 편향성(20~30대 남성이 우세하고 여성, 어린이의 목소리에 소재가 부족하다는 점) 및 노인), 어휘 가변성 부족(동일한 문구의 반복) 및 왜곡되기 쉬운 MP3 녹음의 배포.

Common Voice 7.0의 새 버전에 대해

이 새 버전에서 75명이 넘는 사람들이 참여했습니다. 영어로 자료 준비에서 확인 된 연설의 2637 시간을 지시합니다 (참가자 66 명 및 1686 시간).

또한 처음에 언급했듯이, 이 새로운 버전은 16개의 새로운 언어를 소개합니다 총 76개 언어에 대한 Common Voice 데이터 세트에 포함되었으며, 그 중 총 시간 기준 상위 2.630개 언어는 영어(2.260시간), Kinyarwanda(1.040), 독일어(920), 카탈로니아어(840) 및 에스페란토(XNUMX)입니다.

비율이 가장 많이 증가한 언어는 태국어 (거의 20배 성장, 12시간에서 250시간으로), 루간다(9배 성장, 8시간에서 80시간으로), 에스페란토 말 (7배 이상 성장, 100시간에서 840시간으로) 타밀어 (8시간에서 24시간으로 220배 이상 성장). 신기하게도, 르완다, 누적 데이터 XNUMX위, 2260시간이 수집되었습니다. 그 다음으로 독일어(1040), 카탈루냐어(920), 에스페란토(840)가 그 뒤를 잇습니다. 데이터 세트에는 이제 182,000명 이상의 고유한 목소리가 포함되어 있으며, 이는 단 25개월 만에 납세자 커뮤니티에서 XNUMX% 성장한 것입니다.

또한 프로젝트 참여의 일환으로, NVIDIA는 기계 학습 시스템을 위해 바로 사용할 수 있는 훈련된 모델을 준비했습니다. 수집된 데이터를 기반으로 합니다(PyTorch와 호환). 이 모델은 예를 들어 MTS 및 Sberbank의 자동화된 음성 서비스에서 이미 사용 중인 무료 개방형 NVIDIA NeMo 도구의 일부로 배포됩니다.

모델들은 자연어의 음성 인식, 음성 합성 및 정보 처리 시스템을 목표로 함 음성 대화 시스템, 필사 플랫폼 및 자동화된 콜 센터를 설계하는 연구원에게 유용할 수 있습니다. 이전에 사용 가능한 프로젝트와 달리 게시된 모델은 영어 인식에 국한되지 않고 다양한 언어, 억양 및 음성 형식을 다룹니다.

최종적으로 그것에 대해 더 많이 알고 싶다면에서 세부 정보를 확인할 수 있습니다. 다음 링크.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자: AB Internet Networks 2008 SL
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.