Spraak is in toenemende mate een methode die wordt gebruikt om met onze apparaten te communiceren, en is bovendien de enige methode voor degenen die dit soort toegankelijkheidsmethoden nodig hebben. In elk geval is het redelijk comfortabel om te spreken om tekst te dicteren of om gewoon spraakopdrachten in onze systemen in te voeren, zodat ze een bewerking uitvoeren zonder hun handen te gebruiken. Het probleem is dat spraakherkenning ze zijn gebaseerd op engines die wiskundige algoritmen gebruiken om spraak te herkennen en zijn niet 100% betrouwbaar.
Technologische vooruitgang brengt steeds meer de betrouwbaarheid tot in de perfectie, en kunstmatige intelligentie en big data-systemen helpen ook veel om spraakherkenningsprogramma's enorm te verbeteren. De laatste tijd worden er veel inspanningen geleverd om deze systemen maximaal te verbeteren, en veel studies richten zich erop om de controle te verbeteren en ze de interface van de toekomst te maken. Houd er rekening mee dat de huidige interfaces minder natuurlijk zijn voor mensen en minder snel dan spraak.
Spraakherkenningssystemen zullen de komende jaren een waarde hebben van ongeveer 10 miljard dollar en daarom richten grote bedrijven zich op de ontwikkeling van assistenten zoals Apple's Siri, Microsoft's Cortana of Mycroft voor Linux, naast dat ze steeds populairder worden en frequente producten zoals Amazon Echo, Google Home of Apple HomePod voor thuis, en ook geavanceerde spraakherkenningssystemen integreren in verbonden auto's.
Dat gezegd hebbende, onze lijst met spraakherkenningstools voor Linux zijn:
- Julius: is een krachtige engine voor continue spraakherkenning met veel woordenschat.
- diepe spraak: is een TensorFLow-implementatie van Baidu's DeepSpeech-architectuur.
- Simon: een redelijk flexibele spraakherkenningssoftware.
- Kaldi: is een C ++ ontwerptoolkit voor onderzoek naar spraakherkenning.
- CMUSfinx: in dit geval is het een spraakherkenningsengine voor mobiele apps en servers.
- deepspeech.python: is een implementatie van DeepSPeech met Python en met behulp van Baidu Warp-CTC.
Zeer goed, en komt er een goede TTS (tekst-naar-spraak) voor Linux?
In Windows en Android zijn er stemmen van zeer goede kwaliteit, zoals Loquendo, Ivona of NeoSpeech, maar die zijn niet voor Linux. Op Linux heb ik de mbrola- en picoTTS-stemmen geprobeerd, maar ze zijn erg robotachtig.
Cepstral biedt gratis Alejandra's stem voor Linux, wat best goed is, maar ik wist niet hoe ik het moest installeren.
Ik loop hetzelfde binnen als je een goed aandeel krijgt
Je kunt loquendo gebruiken met wijn op Linux. Ik raad deze video aan ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Ik heb geprobeerd een assistent te installeren, ik bedoel, Google Assistent en ik kon het niet, ik bleef in het deel van het registerbestand, ik denk dat het heet. Jammer dat Alexa onzin is ...
Het espeak-programma werkt op de debian apt install espeak-console. En doe bijvoorbeeld mee met espeak -ves «Hallo wereld»
de -ves is v = stemmen is = Spaans
Je hebt veel opties om een tekstbestand te lezen, het resultaat naar een wav-bestand te schrijven.
groeten
de waarheid is allemaal erg slecht, ramen dat is een andere wereld ... hier lopen ze 10 jaar achter
En 3 jaar later, ja! dit is nog te laat.