La voce è sempre più un metodo utilizzato per interagire con i nostri dispositivi, oltre ad essere l'unico metodo per chi necessita di questo tipo di metodi di accessibilità. In ogni caso, è abbastanza comodo parlare per dettare testo o semplicemente inserire comandi vocali nei nostri sistemi in modo che eseguano qualche tipo di operazione senza usare le mani. Il problema è che riconoscimento vocale sono basati su motori che utilizzano algoritmi matematici per riconoscere il parlato e non sono affidabili al 100%.
I progressi tecnologici stanno portando sempre più il affidabilità alla perfezione, e anche l'intelligenza artificiale ei sistemi di big data stanno aiutando molto a migliorare enormemente i programmi di riconoscimento vocale. Ultimamente si stanno facendo molti sforzi per migliorare questi sistemi al massimo, e molti studi si stanno concentrando su di esso per migliorare il controllo e renderli l'interfaccia del futuro. Tieni presente che le interfacce attuali sono meno naturali per le persone e meno veloci della voce.
I sistemi di riconoscimento vocale avranno un valore di circa 10 miliardi di dollari nei prossimi anni ed è per questo che le grandi aziende si stanno concentrando sullo sviluppo di assistenti come Siri di Apple, Cortana di Microsoft o Mycroft per Linux, oltre a diventare prodotti sempre più popolari e frequenti come Amazon Echo, Google Home o Apple HomePod per la casa, oltre a integrare sofisticati sistemi di riconoscimento vocale nelle auto connesse.
Detto questo, il nostro elenco di strumenti di riconoscimento vocale per Linux sono:
- Giulio: è un potente motore di riconoscimento vocale continuo con molto vocabolario.
- discorso profondo: è un'implementazione TensorFLow dell'architettura DeepSpeech di Baidu.
- Simon: un software di riconoscimento vocale abbastanza flessibile.
- Kaldor: è un toolkit di progettazione C ++ per la ricerca sul riconoscimento vocale.
- CMUSfinge: in questo caso si tratta di un motore di riconoscimento vocale per app e server mobili.
- deepspeech.python: è un'implementazione di DeepSPeech con Python e utilizza Baidu Warp-CTC.
Molto buono, e ci sarà un buon TTS (text to speech) per Linux?
In Windows e Android ci sono voci di ottima qualità come Loquendo, Ivona o NeoSpeech, ma non sono per Linux. Su Linux ho provato le voci mbrola e picoTTS ma sono molto robotiche.
Cepstral offre una voce Alejandra gratuita per Linux che è abbastanza buona, ma non sapevo come installarla.
Cammino nello stesso modo se ottieni una buona parte
Puoi usare loquendo con wine su Linux. Consiglio questo video ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Ho provato a installare un assistente, voglio dire, Assistente Google e non ci sono riuscito, sono rimasto nella parte del file di registro, credo si chiami. Peccato che Alexa sia una schifezza ...
Il programma espeak funziona sulla console debian apt install espeak. E unisciti ad esempio a espeak -ves «Hello World»
il -ves è v = voci è = spagnolo
Hai molte opzioni per leggere un file di testo, scrivere il risultato in un file wav.
saluti
la verità è tutto molto brutto, finestre che è un altro mondo ... eccole 10 anni indietro
E 3 anni dopo, sì! questo è ancora in ritardo.