De beste spraakherkenningstools voor Linux

2 minuten

Spraak is in toenemende mate een methode die wordt gebruikt om met onze apparaten te communiceren, en is bovendien de enige methode voor degenen die dit soort toegankelijkheidsmethoden nodig hebben. In elk geval is het redelijk comfortabel om te spreken om tekst te dicteren of om gewoon spraakopdrachten in onze systemen in te voeren, zodat ze een bewerking uitvoeren zonder hun handen te gebruiken. Het probleem is dat spraakherkenning ze zijn gebaseerd op engines die wiskundige algoritmen gebruiken om spraak te herkennen en zijn niet 100% betrouwbaar.

Technologische vooruitgang brengt steeds meer de betrouwbaarheid tot in de perfectie, en kunstmatige intelligentie en big data-systemen helpen ook veel om spraakherkenningsprogramma's enorm te verbeteren. De laatste tijd worden er veel inspanningen geleverd om deze systemen maximaal te verbeteren, en veel studies richten zich erop om de controle te verbeteren en ze de interface van de toekomst te maken. Houd er rekening mee dat de huidige interfaces minder natuurlijk zijn voor mensen en minder snel dan spraak.

Spraakherkenningssystemen zullen de komende jaren een waarde hebben van ongeveer 10 miljard dollar en daarom richten grote bedrijven zich op de ontwikkeling van assistenten zoals Apple's Siri, Microsoft's Cortana of Mycroft voor Linux, naast dat ze steeds populairder worden en frequente producten zoals Amazon Echo, Google Home of Apple HomePod voor thuis, en ook geavanceerde spraakherkenningssystemen integreren in verbonden auto's.

Dat gezegd hebbende, onze lijst met spraakherkenningstools voor Linux zijn:

Julius: is een krachtige engine voor continue spraakherkenning met veel woordenschat.
diepe spraak: is een TensorFLow-implementatie van Baidu's DeepSpeech-architectuur.
Simon: een redelijk flexibele spraakherkenningssoftware.
Kaldi: is een C ++ ontwerptoolkit voor onderzoek naar spraakherkenning.
CMUSfinx: in dit geval is het een spraakherkenningsengine voor mobiele apps en servers.
deepspeech.python: is een implementatie van DeepSPeech met Python en met behulp van Baidu Warp-CTC.

Laat je reactie achter Antwoord annuleren

Miguel Angel zei
geleden Tot 6 jaar

Zeer goed, en komt er een goede TTS (tekst-naar-spraak) voor Linux?

In Windows en Android zijn er stemmen van zeer goede kwaliteit, zoals Loquendo, Ivona of NeoSpeech, maar die zijn niet voor Linux. Op Linux heb ik de mbrola- en picoTTS-stemmen geprobeerd, maar ze zijn erg robotachtig.

Cepstral biedt gratis Alejandra's stem voor Linux, wat best goed is, maar ik wist niet hoe ik het moest installeren.

Reageer op Miguel Angel
1. RAUL zei
  geleden Tot 6 jaar
  
  Ik loop hetzelfde binnen als je een goed aandeel krijgt
  
  Reageer op rAUL
  1. Armando zei
    geleden Tot 6 jaar
    
    Je kunt loquendo gebruiken met wijn op Linux. Ik raad deze video aan ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    Reageer op Armando
Nasher_87 (ARG) zei
geleden Tot 6 jaar

Ik heb geprobeerd een assistent te installeren, ik bedoel, Google Assistent en ik kon het niet, ik bleef in het deel van het registerbestand, ik denk dat het heet. Jammer dat Alexa onzin is ...

Reageer op Nasher_87 (ARG)
Gerardo zei
geleden Tot 6 jaar

Het espeak-programma werkt op de debian apt install espeak-console. En doe bijvoorbeeld mee met espeak -ves «Hallo wereld»

de -ves is v = stemmen is = Spaans

Je hebt veel opties om een tekstbestand te lezen, het resultaat naar een wav-bestand te schrijven.

groeten

Reageer op Gerardo
rivier zei
geleden Tot 6 jaar

de waarheid is allemaal erg slecht, ramen dat is een andere wereld ... hier lopen ze 10 jaar achter

Reageer op raul
1. Raul zei
  geleden Tot 2 jaar
  
  En 3 jaar later, ja! dit is nog te laat.
  
  Reageer op Raul