Die besten Spracherkennungswerkzeuge für Linux

Spracherkennungshintergrund

Sprache wird zunehmend für die Interaktion mit unseren Geräten verwendet und ist nicht nur die einzige Methode für diejenigen, die diese Art von Eingabehilfen benötigen. In jedem Fall ist es recht bequem zu sprechen, um Text zu diktieren oder einfach Sprachbefehle in unsere Systeme einzugeben, damit sie eine Operation ausführen können, ohne ihre Hände zu benutzen. Das Problem ist, dass Spracherkennung Sie basieren auf Engines, die mathematische Algorithmen zur Spracherkennung verwenden und nicht 100% zuverlässig sind.

Technologische Fortschritte bringen zunehmend die Zuverlässigkeit Perfektion und künstliche Intelligenz und Big-Data-Systeme tragen ebenfalls erheblich dazu bei, Spracherkennungsprogramme enorm zu verbessern. In letzter Zeit werden viele Anstrengungen unternommen, um diese Systeme maximal zu verbessern, und viele Studien konzentrieren sich darauf, um die Steuerung zu verbessern und sie zur Schnittstelle der Zukunft zu machen. Beachten Sie, dass aktuelle Schnittstellen für Menschen weniger natürlich und weniger schnell als Sprache sind.

Spracherkennungssysteme werden in den kommenden Jahren einen Wert von rund 10 Milliarden US-Dollar haben. Deshalb konzentrieren sich große Unternehmen auf die Entwicklung von Assistenten wie Siri von Apple, Cortana von Microsoft oder Mycroft für LinuxDarüber hinaus werden Produkte wie Amazon Echo, Google Home oder Apple HomePod für zu Hause immer beliebter und häufiger und integrieren hochentwickelte Spracherkennungssysteme in vernetzte Autos.

Das sagte, unsere Liste der Spracherkennungswerkzeuge für Linux sind:

  • Julius: ist eine leistungsstarke kontinuierliche Spracherkennungs-Engine mit viel Wortschatz.
  • DeepSpeech: ist eine TensorFLow-Implementierung der DeepSpeech-Architektur von Baidu.
  • Bernd: eine ziemlich flexible Spracherkennungssoftware.
  • Kaldi: ist ein C ++ - Design-Toolkit für die Spracherkennungsforschung.
  • CMUSphinx: In diesem Fall handelt es sich um eine Spracherkennungs-Engine für mobile Apps und Server.
  • deepspeech.python: ist eine Implementierung von DeepSPeech mit Python und unter Verwendung von Baidu Warp-CTC.

7 Kommentare, hinterlasse deine

Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: AB Internet Networks 2008 SL
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.

  1.   Miguel Angel sagte

    Sehr gut, und wird es ein gutes TTS (Text to Speech) für Linux geben?

    In Windows und Android gibt es Stimmen von sehr guter Qualität wie Loquendo, Ivona oder NeoSpeech, aber sie sind nicht für Linux. Unter Linux habe ich die Stimmen mbrola und picoTTS ausprobiert, aber sie sind sehr roboterhaft.

    Cepstral bietet eine kostenlose Alejandra-Stimme für Linux an, die ziemlich gut ist, aber ich wusste nicht, wie ich sie installieren soll.

    1.    RAUL sagte

      Ich gehe genauso, wenn Sie einen guten Anteil bekommen

      1.    Armando sagte

        Sie können Loquendo mit Wein unter Linux verwenden. Ich empfehle dieses Video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) sagte

    Ich habe versucht, einen Assistenten zu installieren, ich meine, Google Assistant, und ich konnte nicht, ich blieb im Teil der Registrierungsdatei, ich glaube, er heißt. Schade, dass Alexa Mist ist ...

  3.   Gerardo sagte

    Das espeak-Programm funktioniert auf der debian apt install espeak-Konsole. Und schließen Sie sich zum Beispiel espeak -ves «Hello World» an.

    das -ves ist v = Stimmen ist = Spanisch

    Sie haben viele Möglichkeiten, eine Textdatei zu lesen und das Ergebnis in eine WAV-Datei zu schreiben.

    Grüße

  4.   Fluss sagte

    Die Wahrheit ist alles sehr schlecht, Fenster, die eine andere Welt sind ... hier sind sie 10 Jahre zurück

    1.    Raul sagte

      Und 3 Jahre später, ja! das ist noch überfällig.