Parimad kõnetuvastustööriistad Linuxile

Häältuvastuse taust

Hääl on üha enam meetod, mida kasutatakse meie seadmetega suhtlemiseks, lisaks sellele, et see on ainus meetod neile, kes seda tüüpi juurdepääsetavuse meetodeid vajavad. Igal juhul on teksti dikteerimiseks või lihtsalt häälkäskluste sisestamiseks meie süsteemidesse rääkimine üsna mugav, nii et nad teevad mingeid toiminguid ilma oma käsi kasutamata. Probleem on selles kõnetuvastus need põhinevad mootoritel, mis kasutavad kõne äratundmiseks matemaatilisi algoritme ega ole 100% usaldusväärsed.

Tehnoloogia areng toob üha enam kaasa usaldusväärsust täiuslikkuseni ning tehisintellekt ja suurandmesüsteemid aitavad samuti kõnetuvastusprogramme tohutult täiustada. Viimasel ajal tehakse palju jõupingutusi nende süsteemide maksimaalseks täiustamiseks ning paljudes uuringutes keskendutakse sellele, et parandada juhtimist ja muuta need tuleviku liideseks. Pidage meeles, et praegused liidesed on inimeste jaoks vähem loomulikud ja vähem kiired kui hääl.

Hääletuvastussüsteemide väärtus on lähiaastatel umbes 10 miljardit dollarit ja seetõttu keskenduvad suured ettevõtted selliste assistentide arendamisele nagu Apple'i Siri, Microsofti Cortana või Mycroft Linuxile, lisaks üha populaarsematele ja sagedasematele toodetele nagu Amazon Echo, Google Home või Apple HomePod kodule, samuti keerukate hääletuvastussüsteemide integreerimisele ühendatud autodesse.

See ütles meie Linuxi kõnetuvastustööriistade loend Heli:

  • Julius: on võimas pideva kõne tuvastamise mootor, kus on palju sõnavara.
  • Sügav Kõne: on Baidu DeepSpeechi arhitektuuri TensorFLow juurutus.
  • Simon: üsna paindlik kõnetuvastustarkvara.
  • kaldi: on C ++ disaini tööriistakomplekt kõnetuvastuse uurimiseks.
  • CMUSphinx: antud juhul on see mobiilirakenduste ja serverite kõnetuvastusmootor.
  • deepspeech.python: on DeepSPeechi rakendus Pythoniga ja Baidu Warp-CTC abil.

Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.

  1.   Miguel Ingel DIJO

    Väga hea ja kas Linuxi jaoks on ka mõni hea TTS (tekst kõneks)?

    Windowsis ja Androidis on väga hea kvaliteediga hääli nagu Loquendo, Ivona või NeoSpeech, kuid need pole mõeldud Linuxile. Linuxis proovisin mbrola ja picoTTS hääli, kuid need on väga robotlikud.

    Cepstral pakub Linuxile tasuta Alejandra häält, mis on üsna hea, kuid ma ei teadnud, kuidas seda installida.

    1.    RAUL DIJO

      Ma kõnnin sama, kui saate hea osa

      1.    Armando DIJO

        Linuxil saate kasutada loquendot koos veiniga. Soovitan seda videot ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) DIJO

    Proovisin installida assistenti, ma mõtlen, Google'i assistenti ja ma ei suutnud, jäin registrifaili ossa, arvan, et seda kutsutakse. Kahju, et Alexa on jama ...

  3.   Gerardo DIJO

    Espeak programm töötab debiani apt install espeak konsoolis. Ja liitu näiteks espeak -ves «Tere maailm»

    -ves on v = hääled on = hispaania keel

    Teil on palju võimalusi tekstifaili lugemiseks, tulemuse kirjutamiseks wav-faili.

    seoses

  4.   jõgi DIJO

    tõde on kõik väga halb, aknad, mis on teine ​​maailm ... siin on nad 10 aastat taga

    1.    Raul DIJO

      Ja 3 aastat hiljem, jah! see on ikka hilinenud.