Ang pinakamahusay na mga tool sa pagkilala sa pagsasalita para sa Linux

Background ng pagkilala sa boses

Ang boses ay lalong ginagamit upang makipag-ugnay sa aming mga aparato, bilang karagdagan sa pagiging nag-iisang pamamaraan para sa mga nangangailangan ng ganitong uri ng mga pamamaraan sa kakayahang mai-access. Sa anumang kaso, ito ay lubos na komportable na magsalita upang idikta ang teksto o ipasok lamang ang mga utos ng boses sa aming mga system upang gumawa sila ng isang uri ng operasyon nang hindi ginagamit ang kanilang mga kamay. Ang problema nun pagkilala sa pagsasalita ang mga ito ay batay sa mga makina na gumagamit ng mga matematika algorithm upang makilala ang pagsasalita at hindi 100% maaasahan.

Teknikal na pagsulong ay lalong nagdadala ng pagiging maaasahan sa pagiging perpekto, at ang artipisyal na katalinuhan at malalaking mga system ng data ay tumutulong din ng malaki upang mapabuti ang mga programa sa pagkilala sa pagsasalita nang labis. Kamakailan lamang maraming mga pagsisikap ang inilalagay upang mapagbuti ang mga sistemang ito sa maximum, at maraming mga pag-aaral ang nakatuon dito upang mapabuti ang kontrol at gawin silang interface ng hinaharap. Tandaan na ang mga kasalukuyang interface ay hindi gaanong natural para sa mga tao at mas mabilis kaysa sa boses.

Ang mga sistema ng pagkilala sa boses ay magkakaroon ng halaga na humigit-kumulang 10 bilyong dolyar sa mga darating na taon at iyon ang dahilan kung bakit ang mga malalaking kumpanya ay nakatuon sa pagbuo ng mga katulong tulad ng Siri ng Apple, Cortana ng Microsoft o Mycroft para sa Linux, bilang karagdagan sa pagiging unting tanyag at madalas na mga produkto tulad ng Amazon Echo, Google Home, o Apple HomePod para sa bahay, pati na rin ang pagsasama ng mga sopistikadong system ng pagkilala sa boses sa mga konektadong kotse.

Na sinabi, ang aming listahan ng mga tool sa pagkilala sa pagsasalita para sa Linux tunog:

  • Julius: ay isang malakas na tuluy-tuloy na makina ng pagkilala sa pagsasalita na may maraming bokabularyo.
  • DeepSpeech: ay isang pagpapatupad ng TensorFLow ng arkitekturang DeepSpeech ng Baidu.
  • Simon: isang medyo nababaluktot na software ng pagkilala sa pagsasalita.
  • kaldi: ay isang toolkit ng disenyo ng C ++ para sa pananaliksik sa pagkilala sa pagsasalita.
  • CMUSphinx: sa kasong ito ito ay isang engine ng pagkilala sa boses para sa mga mobile app at server.
  • deepspeech.python: ay isang pagpapatupad ng DeepSPeech kasama ang Python at paggamit ng Baidu Warp-CTC.

Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: AB Internet Networks 2008 SL
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.

  1.   Miguel Angel dijo

    Napakahusay, at magkakaroon ba ng anumang magagandang TTS (teksto sa pagsasalita) para sa linux?

    Sa Windows at Android mayroong napakahusay na mga tinig ng kalidad tulad ng Loquendo, Ivona o NeoSpeech, ngunit hindi sila para sa Linux. Sa Linux sinubukan ko ang mbrola at mga picoTTS na boses ngunit ang mga ito ay napaka robotic.

    Nag-aalok ang Cepstral ng isang libreng boses ng Alejandra para sa linux na medyo mabuti, ngunit hindi ko alam kung paano ito i-install.

    1.    raUL dijo

      Pareho ang lakad ko kung nakakakuha ka ng magandang pagbabahagi

      1.    Armando dijo

        Maaari mong gamitin ang loquendo na may alak sa linux. Inirerekumenda ko ang video na ito ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Sinubukan kong mag-install ng isang katulong, ibig sabihin, Google Assistant at hindi ko magawa, nanatili ako sa bahagi ng registry file, sa palagay ko ito ay tinawag. Napakasamang si Alexa ay basura ...

  3.   Gerardo dijo

    Gumagana ang programa ng espeak sa debian apt na mag-install ng espeak console. At sumali halimbawa speak -ves «Hello World»

    ang -ves ay v = tinig ay = Espanyol

    Mayroon kang maraming mga pagpipilian upang basahin ang isang text file, isulat ang resulta sa isang wav file.

    Regards

  4.   raul dijo

    ang totoo ay napakasama, ang mga bintana na ibang mundo ... narito ang 10 taon na sila

    1.    Raul dijo

      At makalipas ang 3 taon, oo! overdue pa ito.