Najbolji alati za prepoznavanje govora za Linux

Pozadina prepoznavanja glasa

Glas se sve više koristi za interakciju s našim uređajima, uz to što je jedina metoda za one koji trebaju ovu vrstu metoda pristupačnosti. U svakom je slučaju vrlo ugodno govoriti kako bi se diktirao tekst ili jednostavno unijeti glasovne naredbe u naše sustave tako da oni izvršavaju neku vrstu radnje bez upotrebe ruku. Problem je u tome prepoznavanje glasa temelje se na mehanizmima koji koriste matematičke algoritme za prepoznavanje govora i nisu 100% pouzdani.

Tehnološki napredak sve više donosi pouzdanost do savršenstva, a umjetna inteligencija i sustavi velikih podataka također uvelike pomažu u poboljšanju programa prepoznavanja govora. U posljednje vrijeme ulažu se mnogi napori kako bi se ti sustavi maksimalno poboljšali, a mnoga istraživanja se usredotočuju na to kako bi poboljšala kontrolu i učinila ih sučeljem budućnosti. Imajte na umu da su trenutna sučelja manje prirodna za ljude i manje su brza od glasa.

Sustavi za prepoznavanje glasa imat će vrijednost oko 10 milijardi dolara u sljedećim godinama i zato se velike tvrtke usredotočuju na razvoj pomoćnika poput Appleove Siri, Microsoftove Cortane ili Mycroft za Linux, uz to što postaju sve popularniji i češći proizvodi poput Amazon Echo, Google Home ili Apple HomePod za dom, kao i integriranje sofisticiranih sustava za prepoznavanje glasa u povezane automobile.

To je rekao, naš popis alata za prepoznavanje govora za Linux zvuk:

  • Julius: moćan je mehanizam za kontinuirano prepoznavanje govora s puno rječnika.
  • Duboki govor: je implementacija TensorFLow Baidu-ove DeepSpeech arhitekture.
  • Simon: prilično fleksibilan softver za prepoznavanje govora.
  • kaldi: je C ++ dizajn alata za istraživanje prepoznavanja govora.
  • CMUSfinga: u ovom slučaju to je mehanizam za prepoznavanje glasa za mobilne aplikacije i poslužitelje.
  • duboki govor.python: je implementacija DeepSPeech-a s Pythonom i koristeći Baidu Warp-CTC.

7 komentara, ostavi svoj

Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Odgovoran za podatke: AB Internet Networks 2008 SL
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.

  1.   Miguel Angel dijo

    Vrlo dobro, i hoće li postojati neki dobar TTS (pretvaranje teksta u govor) za linux?

    U sustavima Windows i Android postoje vrlo kvalitetni glasovi kao što su Loquendo, Ivona ili NeoSpeech, ali oni nisu za Linux. Na Linuxu sam isprobao glasove mbrola i picoTTS, ali vrlo su robotski.

    Cepstral nudi besplatni glas Alejandra za linux, što je prilično dobro, ali nisam znao kako ga instalirati.

    1.    RAUL dijo

      Hodam istim ako dobijete dobar udio

      1.    Armando dijo

        Loquendo možete koristiti s vinom na linuxu. Preporučujem ovaj video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Pokušao sam instalirati pomoćnika, mislim, Google asistenta i nisam uspio, ostao sam u dijelu datoteke registra, mislim da se zove. Šteta što je Alexa sranje ...

  3.   Gerardo dijo

    Program espeak radi na debian apt install konzoli espeak. I pridružite se na primjer espeak -ves «Hello World»

    -ves je v = glasovi su = španjolski

    Imate mnogo mogućnosti za čitanje tekstualne datoteke, zapisivanje rezultata u wav datoteku.

    pozdravi

  4.   rijeka dijo

    istina je vrlo loša, prozori to je drugi svijet ... evo zaostaju 10 godina

    1.    Raul dijo

      I 3 godine kasnije, da! ovo još uvijek kasni.