Cele mai bune instrumente de recunoaștere a vorbirii pentru Linux

Fundal de recunoaștere vocală

Vocea este din ce în ce mai multă metodă utilizată pentru a interacționa cu dispozitivele noastre, pe lângă faptul că este singura metodă pentru cei care au nevoie de acest tip de metode de accesibilitate. În orice caz, este destul de confortabil să vorbiți pentru a dicta text sau pur și simplu să introduceți comenzi vocale în sistemele noastre, astfel încât acestea să facă un fel de operație fără a-și folosi mâinile. Problema este că recunoașterea vorbirii se bazează pe motoare care utilizează algoritmi matematici pentru a recunoaște vorbirea și nu sunt 100% fiabile.

Progresele tehnologice aduc din ce în ce mai mult fiabilitate la perfecțiune, iar inteligența artificială și sistemele de date mari ajută, de asemenea, mult la îmbunătățirea enormă a programelor de recunoaștere a vorbirii. În ultima perioadă se depun multe eforturi pentru a îmbunătăți la maximum aceste sisteme și multe studii se concentrează asupra acestuia pentru a îmbunătăți controlul și a le face interfața viitorului. Rețineți că interfețele actuale sunt mai puțin naturale pentru oameni și mai puțin rapide decât vocea.

Sistemele de recunoaștere vocală vor avea o valoare de aproximativ 10 miliarde de dolari în următorii ani și de aceea companiile mari se concentrează pe dezvoltarea asistenților precum Apple Siri, Microsoft Cortana sau Mycroft pentru Linux, pe lângă faptul că devin produse din ce în ce mai populare și frecvente precum Amazon Echo, Google Home sau Apple HomePod pentru casă, precum și integrarea sistemelor sofisticate de recunoaștere a vocii în mașinile conectate.

Acestea fiind spuse, lista noastră de instrumente de recunoaștere a vorbirii pentru Linux sunet:

  • Julius: este un puternic motor continuu de recunoaștere a vorbirii, cu mult vocabular.
  • Deep Speech: este o implementare TensorFLow a arhitecturii DeepSpeech a lui Baidu.
  • Simon: un software destul de flexibil de recunoaștere a vorbirii.
  • caldi: este un set de instrumente de proiectare C ++ pentru cercetarea recunoașterii vorbirii.
  • CMUSphinx: în acest caz este un motor de recunoaștere vocală pentru aplicații și servere mobile.
  • deepspeech.python: este o implementare a DeepSPeech cu Python și folosind Baidu Warp-CTC.

Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: AB Internet Networks 2008 SL
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.

  1.   Miguel Angel el a spus

    Foarte bine și va exista vreun TTS bun (text to speech) pentru Linux?

    În Windows și Android există voci de foarte bună calitate, precum Loquendo, Ivona sau NeoSpeech, dar nu sunt pentru Linux. Pe Linux am încercat vocile mbrola și picoTTS, dar sunt foarte robotizate.

    Cepstral oferă o voce Alejandra gratuită pentru Linux, care este destul de bună, dar nu știam cum să o instalez.

    1.    RAUL el a spus

      Merg la fel dacă primești o cotă bună

      1.    Armando el a spus

        Puteți folosi loquendo cu vin pe Linux. Recomand acest videoclip ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) el a spus

    Am încercat să instalez un asistent, adică Google Assistant și nu am putut, am rămas în partea din fișierul de registru, cred că se numește. Păcat că Alexa este o porcărie ...

  3.   Gerardo el a spus

    Programul espeak funcționează pe consola debeak apt install espeak. Și alăturați-vă de exemplu speak -ves «Hello World»

    -ves este v = voci este = spaniolă

    Aveți multe opțiuni pentru a citi un fișier text, a scrie rezultatul într-un fișier WAV.

    În ceea ce priveşte

  4.   raul el a spus

    adevărul este foarte rău, ferestrele care sunt o altă lume ... aici sunt cu 10 ani în urmă

    1.    Raul el a spus

      Și 3 ani mai târziu, da! acest lucru este încă întârziat.