I migliori strumenti di riconoscimento vocale per Linux

Sfondo di riconoscimento vocale

La voce è sempre più un metodo utilizzato per interagire con i nostri dispositivi, oltre ad essere l'unico metodo per chi necessita di questo tipo di metodi di accessibilità. In ogni caso, è abbastanza comodo parlare per dettare testo o semplicemente inserire comandi vocali nei nostri sistemi in modo che eseguano qualche tipo di operazione senza usare le mani. Il problema è che riconoscimento vocale sono basati su motori che utilizzano algoritmi matematici per riconoscere il parlato e non sono affidabili al 100%.

I progressi tecnologici stanno portando sempre più il affidabilità alla perfezione, e anche l'intelligenza artificiale ei sistemi di big data stanno aiutando molto a migliorare enormemente i programmi di riconoscimento vocale. Ultimamente si stanno facendo molti sforzi per migliorare questi sistemi al massimo, e molti studi si stanno concentrando su di esso per migliorare il controllo e renderli l'interfaccia del futuro. Tieni presente che le interfacce attuali sono meno naturali per le persone e meno veloci della voce.

I sistemi di riconoscimento vocale avranno un valore di circa 10 miliardi di dollari nei prossimi anni ed è per questo che le grandi aziende si stanno concentrando sullo sviluppo di assistenti come Siri di Apple, Cortana di Microsoft o Mycroft per Linux, oltre a diventare prodotti sempre più popolari e frequenti come Amazon Echo, Google Home o Apple HomePod per la casa, oltre a integrare sofisticati sistemi di riconoscimento vocale nelle auto connesse.

Detto questo, il nostro elenco di strumenti di riconoscimento vocale per Linux sono:

  • Giulio: è un potente motore di riconoscimento vocale continuo con molto vocabolario.
  • discorso profondo: è un'implementazione TensorFLow dell'architettura DeepSpeech di Baidu.
  • Simon: un software di riconoscimento vocale abbastanza flessibile.
  • Kaldor: è un toolkit di progettazione C ++ per la ricerca sul riconoscimento vocale.
  • CMUSfinge: in questo caso si tratta di un motore di riconoscimento vocale per app e server mobili.
  • deepspeech.python: è un'implementazione di DeepSPeech con Python e utilizza Baidu Warp-CTC.

Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile del trattamento: AB Internet Networks 2008 SL
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.

  1.   Miguel Angel suddetto

    Molto buono, e ci sarà un buon TTS (text to speech) per Linux?

    In Windows e Android ci sono voci di ottima qualità come Loquendo, Ivona o NeoSpeech, ma non sono per Linux. Su Linux ho provato le voci mbrola e picoTTS ma sono molto robotiche.

    Cepstral offre una voce Alejandra gratuita per Linux che è abbastanza buona, ma non sapevo come installarla.

    1.    RAUL suddetto

      Cammino nello stesso modo se ottieni una buona parte

      1.    Armando suddetto

        Puoi usare loquendo con wine su Linux. Consiglio questo video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) suddetto

    Ho provato a installare un assistente, voglio dire, Assistente Google e non ci sono riuscito, sono rimasto nella parte del file di registro, credo si chiami. Peccato che Alexa sia una schifezza ...

  3.   Gerardo suddetto

    Il programma espeak funziona sulla console debian apt install espeak. E unisciti ad esempio a espeak -ves «Hello World»

    il -ves è v = voci è = spagnolo

    Hai molte opzioni per leggere un file di testo, scrivere il risultato in un file wav.

    saluti

  4.   raul suddetto

    la verità è tutto molto brutto, finestre che è un altro mondo ... eccole 10 anni indietro

    1.    Raul suddetto

      E 3 anni dopo, sì! questo è ancora in ritardo.