I migliori strumenti di riconoscimento vocale per Linux

2 minuti

La voce è sempre più un metodo utilizzato per interagire con i nostri dispositivi, oltre ad essere l'unico metodo per chi necessita di questo tipo di metodi di accessibilità. In ogni caso, è abbastanza comodo parlare per dettare testo o semplicemente inserire comandi vocali nei nostri sistemi in modo che eseguano qualche tipo di operazione senza usare le mani. Il problema è che riconoscimento vocale sono basati su motori che utilizzano algoritmi matematici per riconoscere il parlato e non sono affidabili al 100%.

I progressi tecnologici stanno portando sempre più il affidabilità alla perfezione, e anche l'intelligenza artificiale ei sistemi di big data stanno aiutando molto a migliorare enormemente i programmi di riconoscimento vocale. Ultimamente si stanno facendo molti sforzi per migliorare questi sistemi al massimo, e molti studi si stanno concentrando su di esso per migliorare il controllo e renderli l'interfaccia del futuro. Tieni presente che le interfacce attuali sono meno naturali per le persone e meno veloci della voce.

I sistemi di riconoscimento vocale avranno un valore di circa 10 miliardi di dollari nei prossimi anni ed è per questo che le grandi aziende si stanno concentrando sullo sviluppo di assistenti come Siri di Apple, Cortana di Microsoft o Mycroft per Linux, oltre a diventare prodotti sempre più popolari e frequenti come Amazon Echo, Google Home o Apple HomePod per la casa, oltre a integrare sofisticati sistemi di riconoscimento vocale nelle auto connesse.

Detto questo, il nostro elenco di strumenti di riconoscimento vocale per Linux sono:

Giulio: è un potente motore di riconoscimento vocale continuo con molto vocabolario.
discorso profondo: è un'implementazione TensorFLow dell'architettura DeepSpeech di Baidu.
Simon: un software di riconoscimento vocale abbastanza flessibile.
Kaldor: è un toolkit di progettazione C ++ per la ricerca sul riconoscimento vocale.
CMUSfinge: in questo caso si tratta di un motore di riconoscimento vocale per app e server mobili.
deepspeech.python: è un'implementazione di DeepSPeech con Python e utilizza Baidu Warp-CTC.

Lascia un tuo commento Annulla risposta

Miguel Angel suddetto
fa 6 anni

Molto buono, e ci sarà un buon TTS (text to speech) per Linux?

In Windows e Android ci sono voci di ottima qualità come Loquendo, Ivona o NeoSpeech, ma non sono per Linux. Su Linux ho provato le voci mbrola e picoTTS ma sono molto robotiche.

Cepstral offre una voce Alejandra gratuita per Linux che è abbastanza buona, ma non sapevo come installarla.

Rispondi a Miguel Angel
1. RAUL suddetto
  fa 6 anni
  
  Cammino nello stesso modo se ottieni una buona parte
  
  Rispondi a rAUL
  1. Armando suddetto
    fa 6 anni
    
    Puoi usare loquendo con wine su Linux. Consiglio questo video ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    Rispondi ad Armando
Nasher_87 (ARG) suddetto
fa 6 anni

Ho provato a installare un assistente, voglio dire, Assistente Google e non ci sono riuscito, sono rimasto nella parte del file di registro, credo si chiami. Peccato che Alexa sia una schifezza ...

Rispondi a Nasher_87 (ARG)
Gerardo suddetto
fa 6 anni

Il programma espeak funziona sulla console debian apt install espeak. E unisciti ad esempio a espeak -ves «Hello World»

il -ves è v = voci è = spagnolo

Hai molte opzioni per leggere un file di testo, scrivere il risultato in un file wav.

saluti

Rispondi a Gerardo
raul suddetto
fa 6 anni

la verità è tutto molto brutto, finestre che è un altro mondo ... eccole 10 anni indietro

Rispondi a raul
1. Raul suddetto
  fa 2 anni
  
  E 3 anni dopo, sì! questo è ancora in ritardo.
  
  Rispondi a Raul