Mozilla Common Voice 7.0 ayaa la timid in ka badan 13,000 oo saacadood oo xog cod ah

Dhawaan NVIDIA iyo Mozilla waxay ku dhawaaqeen sii deynta nooca cusub ee "Mozilla Voice Common 7.0" taas oo ka dhigan in ka badan 13.000 oo saacadood oo ah xogta codka ee asalka wadareed iyo ku darista 16 luqadood oo kale iyo in marka la barbar dhigo cusboonaysiintii u dambaysay, baaxadda mugga maaddada ku hadlaya ururinta wuxuu kordhay ku dhawaad ​​50% dheeraad ah.

Sidoo kale, tirada luqadaha la taageeray ayaa ka kordhay 60 ilaa 76, oo ay kujirto taageero dheeri ah oo loogu talagalay Belarusian, Kazakh, Uzbek, Bulgarian, Armenian, Azerbaijani, iyo Bashkir markii ugu horeysay.

Kuwa aan aqoon u lahayn Codka Guud, waa inay ogaadaan in eKani waa set xogta xogta codka furan ugu weyn adduunka waxaana loogu talagalay in lagu dimuqraadiyeeyo tiknoolajiyadda codka. Waxaa adeegsada cilmi baarayaal, aqoonyahanno iyo horumariyayaal laga bilaabo aduunka oo idil.

Shaqaaluhu waxay abaabulaan beelahooda si ay ugu deeqaan xogta codka ilaa xogta dadweynaha ee MCV, oo qof walba u isticmaali karo inuu ku tababaro tiknoolijiyada codka karti u leh. Iyada oo qayb ka ah iskaashiga NVIDIA con Codka Guud ee Mozilla, moodooyinka lagu tababaray tan iyo xog -ururinta kale ee dadweynaha ayaa bilaash lagu heli karaa iyada oo la adeegsanayo aalad qalab furan oo la yiraahdo NVIDIA NeMo.

Mashruuca ujeeddadiisu tahay in la abaabulo shaqo wada jir ah si loo ururiyo keydka macluumaadka ee habyaalada codka, iyadoo la tixgelinayo dhammaan codadka iyo siyaabaha kala duwan ee loo hadlo. Xogta la uruuriyay oo leh diiwaanno ku dhawaaqid kala duwan oo ah weedho caadi u ah hadalka aadanaha ayaa la adeegsan karaa iyada oo aan la xaddidin nidaamyada barashada mashiinka iyo mashaariicda cilmi baarista.

Sida laga soo xigtay qoraaga maktabadda aqoonsiga hadalka ee joogtada ah ee Vosk, cilladaha Codka Guud ayaa ah hal dhinac oo ka mid ah maaddada codka (u badnaanta ragga ee 20-meeyadii iyo 30-meeyadii iyo maqnaansho la'aanta codka haweenka, carruurta iyo waayeelka), la'aanta kala duwanaanshaha erayada (ku celcelinta weedho isku mid ah) iyo qaybinta cajaladaha MP3 ee u nugul dhalanrog.

Ku saabsan nooca cusub ee Codka Guud 7.0

Qaabkan cusub in ka badan 75 kun oo qof ayaa ka qaybgalay diyaarinta agabyada ku qoran Ingiriisiga, oo ku dhawaaqaya 2637 saacadood oo hadal la xaqiijiyay (waxaa jiray 66 kun oo ka qaybgale iyo 1686 saacadood).

Sidoo kale sidaan hore u soo sheegnay, qaabkan cusub wuxuu soo bandhigayaa 16 luqadood oo cusub galay xog -ururinta Codka Guud wadar ahaan 76 luqadood, kuwaas oo shanta luqadood ee ugu sarreeya saacadaha guud ay yihiin Ingiriis (2.630 saacadood), Kinyarwanda (2.260), Jarmal (1.040), Catalan (920) iyo Esperanto (840).

Afafka ugu badan ee boqolkiiba kordhay waa Thai (ku dhawaad ​​20-laab koritaan, laga bilaabo 12 saacadood ilaa 250 saacadood), luganda (9-laab koritaan, laga bilaabo 8 saacadood ilaa 80 saacadood), Esperanto (koritaan ka badan 7 jeer, laga bilaabo 100 saacadood ilaa 840 saacadood) iyo Tamil (koritaan ka badan 8x, laga bilaabo 24 saac ilaa 220 saacadood). Cajiib, Rwanda waxay ku jirtaa kaalinta labaad xagga xogta isugeynta, kaas oo la ururiyey 2260 saacadood. Waxaa ku xiga Jarmalka (1040), Catalan (920) iyo Esperanto (840). Xog -ururinta hadda waxay soo bandhigtay in ka badan 182,000 codad gaar ah, oo ah 25% kobcinta bulshada canshuur -bixiyeyaasha lix bilood gudahood.

Waxa kale oo la xusay in qayb ka ahaanshahooda mashruuca, NVIDIA waxay diyaarisay moodallo tababaran oo diyaar u ah isticmaalka hababka barashada mashiinka oo ku salaysan xogta la uruuriyay (oo la jaanqaadi karta PyTorch). Moodooyinka waxaa loo qaybiyaa iyada oo qayb ka ah aaladda NVIDIA NeMo lacag la'aan ah oo furan, taas oo, tusaale ahaan, horay loogu adeegsaday adeegyada codka otomaatiga ah ee MTS iyo Sberbank.

Moodooyinka waa loogu talagalay aqoonsiga hadalka, isku -darka hadalka iyo hababka habaynta macluumaadka ee luqadda dabiiciga ah waxayna waxtar u yeelan karaan cilmi -baarayaasha naqshadaynta hababka wada -hadalka codka, aaladaha qoraalka, iyo xarumaha wicitaanka ee iswada. Si ka duwan mashaariicdii hore loo heli jiray, moodooyinka la daabacay kuma koobna aqoonsi Ingiriis oo waxay daboolaan luqado kala duwan, lahjadaha iyo qaababka hadalka.

Finalmente hadaad xiisaynayso inaad waxbadan ka ogaato, waxaad ka eegi kartaa faahfaahinta xiriirka soo socda.


Ka tag faalladaada

cinwaanka email aan la daabacin doonaa. Beeraha loo baahan yahay waxaa lagu calaamadeeyay la *

*

*

  1. Ka mas'uul ah xogta: AB Internet Networks 2008 SL
  2. Ujeedada xogta: Xakamaynta SPAM, maaraynta faallooyinka.
  3. Sharci: Oggolaanshahaaga
  4. Isgaarsiinta xogta: Xogta looma gudbin doono dhinacyada saddexaad marka laga reebo waajibaadka sharciga ah.
  5. Kaydinta xogta: Macluumaadka ay martigelisay Shabakadaha Occentus (EU)
  6. Xuquuqda: Waqti kasta oo aad xadidi karto, soo ceshan karto oo tirtiri karto macluumaadkaaga.