Mozilla Common Voice 7.0 13,000 сааттан ашык үн маалыматы менен келет

жакында NVIDIA жана Mozilla "Mozilla Common Voice 7.0" жаңы версиясын чыгарганын жарыялашты бул жамааттык келип чыккан 13.000 сааттан ашык үн маалыматын жана дагы 16 тилди кошууну билдирет акыркы жаңыртууга салыштырмалуу, өлчөмү материалдык көлөмү жыйнакта сүйлөө ал дээрлик 50% га көбөйдү.

Мындан тышкары, колдоого алынган тилдердин саны 60тан 76га чейин көбөйдүбиринчи жолу белорус, казак, өзбек, болгар, армян, азербайжан жана башкыр тилдерине кошумча колдоо көрсөтүү.

Common Voice менен тааныш эмес адамдар үчүн, алар билиши керек дБул ачык маалымат үн маалымат топтому дүйнөдөгү эң чоң жана үн технологиясын демократиялаштыруу үчүн иштелип чыккан. Бул изилдөөчүлөр, академиктер жана иштеп чыгуучулар тарабынан колдонулат бардык дүйнөнүн.

Кызматкерлер өз жамааттарын үн маалыматтарын тартууга мобилизациялайт MCVнин коомдук маалымат базасына, ким үн менен иштөөчү технологияны үйрөтүү үчүн колдоно алат. NVIDIA кызматташтыгынын бир бөлүгү катары cMozilla Common Voice боюнча, ушул жана башка жалпыга ачык маалымат топтомунда үйрөтүлгөн моделдер бекер жеткиликтүү NVIDIA NeMo деп аталган ачык булак куралы аркылуу.

долбоору үн шаблондорунун маалымат базасын топтоо боюнча биргелешкен иштерди уюштурууга багытталган, үндөрдүн жана сүйлөө ыкмаларынын ар түрдүүлүгүн эске алуу менен. Адамдын сүйлөөсүнө мүнөздүү фразалардын ар кандай айтылышын камтыган топтолгон маалымат базасы машиналарды үйрөнүү системаларында жана илимий долбоорлордо чектөөсүз колдонулушу мүмкүн.

Vosk тынымсыз сүйлөө таануу китепканасынын авторунун айтымында, Common Voice топтомунун кемчиликтери-вокалдык материалдын бир жактуу болушу (20-30 жаштагы эркектердин басымдуулугу жана аялдардын, балдардын үнү менен материалдын жоктугу). жана улгайган адамдар), лексиканын өзгөрмөлүүлүгүнүн жоктугу (ошол эле фразаларды кайталоо) жана бурмалоого жакын MP3 жазуулардын таралышы.

Common Voice 7.0 жаңы версиясы жөнүндө

Бул жаңы нускасында 75 миңден ашуун адам катышты англис тилинде материалдарды даярдоодо, 2637 саат ырасталган сөздү диктант (66 миң катышуучу жана 1686 саат болгон).

Ошондой эле биз башында айткандай, бул жаңы версия 16 жаңы тилди киргизет Жалпы үн маалыматы 76 тилде, анын ичинен жалпы беш саат боюнча англис тилинде (2.630 саат), кинярвандада (2.260), немисче (1.040), каталанчада (920) жана эсперантодо (840).

Эң көп пайызга көбөйгөн тилдер тайлар (дээрлик 20 эсе өсүү, 12 сааттан 250 саатка чейин), luganda (9 эсе өсүү, 8 сааттан 80 саатка чейин), Эсперанто (7 эседен ашык өсүү, 100 сааттан 840 саатка чейин) жана Тамил (8xтен ашык өсүү, 24 сааттан 220 саатка чейин). Кызык, Руанда кумулятивдүү маалыматтар боюнча экинчи орунда турат, ал үчүн 2260 саат чогултулган. Алардын артынан немис (1040), каталан (920) жана эсперанто (840) турат. Маалымат топтомунда азыр 182,000ден ашуун уникалдуу үндөр бар, бул алты айда салык төлөөчүлөр коомчулугунун 25% өсүшү.

Долбоорго катышуунун алкагында, NVIDIA машина үйрөнүү системалары үчүн колдонууга даяр моделдерди даярдады чогултулган маалыматтарга негизделген (PyTorch менен шайкеш). Моделдер акысыз жана ачык NVIDIA NeMo инструментинин бир бөлүгү катары таркатылган, ал буга чейин МТСтин жана Сбербанктын автоматташтырылган үн кызматтарында колдонулат.

Моделдер болуп саналат сүйлөөнү таанууга, сүйлөө синтезине жана табигый тилде маалыматты иштетүүгө багытталган жана алар изилдөөчүлөр үчүн үн диалог системасын, транскрипция аянтчаларын жана автоматташтырылган чалуу борборлорун долбоорлоодо пайдалуу болушу мүмкүн. Мурда жеткиликтүү болгон долбоорлордон айырмаланып, жарыяланган моделдер англис тилин таануу менен чектелбейт жана ар кандай тилдерди, акценттерди жана сүйлөө формаларын камтыйт.

акырында ал жөнүндө көбүрөөк билүүгө кызыкдар болсо, сиз маалыматты текшере аласыз төмөнкү шилтеме.


Макаланын мазмуну биздин принциптерге карманат редакциялык этика. Ката жөнүндө кабарлоо үчүн чыкылдатыңыз бул жерде.

Комментарий биринчи болуп

Комментарий калтырыңыз

Сиздин электрондук почта дареги жарыяланбайт. Милдеттүү талаалар менен белгиленет *

*

*

  1. Маалыматтар үчүн жооптуу: AB Internet Networks 2008 SL
  2. Маалыматтын максаты: СПАМды көзөмөлдөө, комментарийлерди башкаруу.
  3. Мыйзамдуулук: Сиздин макулдугуңуз
  4. Маалыматтарды берүү: Маалыматтар үчүнчү жактарга юридикалык милдеттенмелерден тышкары билдирилбейт.
  5. Маалыматтарды сактоо: Occentus Networks (ЕС) тарабынан уюштурулган маалыматтар базасы
  6. Укуктар: Каалаган убакта маалыматыңызды чектеп, калыбына келтирип жана жок кыла аласыз.