Najlepsze narzędzia do rozpoznawania mowy dla systemu Linux

Tło rozpoznawania głosu

Głos jest coraz częściej używany do interakcji z naszymi urządzeniami, będąc jedyną metodą dla tych, którzy potrzebują tego typu metod dostępności. W każdym razie wygodnie jest mówić, dyktować tekst lub po prostu wprowadzać polecenia głosowe do naszych systemów, aby wykonywać jakąś operację bez użycia rąk. Problemem jest rozpoznawanie głosu są one oparte na silnikach, które wykorzystują algorytmy matematyczne do rozpoznawania mowy i nie są w 100% niezawodne.

Postęp technologiczny w coraz większym stopniu powoduje, że niezawodność do perfekcji, a sztuczna inteligencja i systemy dużych zbiorów danych również bardzo pomagają w ulepszaniu programów rozpoznawania mowy. Ostatnio podejmuje się wiele wysiłków, aby ulepszyć te systemy do maksimum, a wiele badań koncentruje się na tym, aby poprawić sterowanie i uczynić z nich interfejs przyszłości. Pamiętaj, że obecne interfejsy są mniej naturalne dla ludzi i wolniejsze niż głos.

Systemy rozpoznawania głosu będą miały w najbliższych latach wartość około 10 miliardów dolarów i właśnie dlatego duże firmy koncentrują się na rozwoju asystentów, takich jak Siri firmy Apple, Cortana firmy Microsoft czy Mycroft dla systemu Linux, oprócz tego, że stają się coraz bardziej popularne i częste produkty, takie jak Amazon Echo, Google Home czy Apple HomePod do użytku domowego, a także integrują zaawansowane systemy rozpoznawania głosu w połączonych samochodach.

To powiedziawszy nasza lista narzędzi do rozpoznawania mowy dla systemu Linux dźwięk:

  • Julius: to potężny silnik do ciągłego rozpoznawania mowy z dużą ilością słownictwa.
  • Głęboka mowa: to implementacja TensorFLow architektury DeepSpeech firmy Baidu.
  • Szymon, Szymek: dość elastyczne oprogramowanie do rozpoznawania mowy.
  • Kaldi: to zestaw narzędzi projektowych C ++ do badań nad rozpoznawaniem mowy.
  • CMUSfinks: w tym przypadku jest to silnik rozpoznawania głosu dla aplikacji mobilnych i serwerów.
  • deepspeech.python: to implementacja DeepSPeech z Pythonem i korzystająca z Baidu Warp-CTC.

Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: AB Internet Networks 2008 SL
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.

  1.   Miguel Angel powiedział

    Bardzo dobrze i czy będzie dobry TTS (zamiana tekstu na mowę) dla Linuksa?

    W systemie Windows i Android są bardzo dobrej jakości głosy, takie jak Loquendo, Ivona czy NeoSpeech, ale nie są one przeznaczone dla Linuksa. W Linuksie wypróbowałem głosy mbrola i picoTTS, ale są one bardzo automatyczne.

    Cepstral oferuje darmowy głos Alejandry dla Linuksa, który jest całkiem niezły, ale nie wiedziałem, jak go zainstalować.

    1.    RAUL powiedział

      Wchodzę tak samo, jeśli dostaniesz dobry udział

      1.    Armando powiedział

        Możesz używać loquendo z winem na Linuksie. Polecam ten film ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) powiedział

    Próbowałem zainstalować asystenta, to znaczy Asystenta Google i nie mogłem, zostałem w części pliku rejestru, myślę, że to się nazywa. Szkoda, że ​​Alexa to gówno ...

  3.   Gerardo powiedział

    Program espeak działa na konsoli debian apt install espeak. I dołącz na przykład espeak -ves «Hello World»

    -ves to v = voices to = hiszpański

    Masz wiele opcji, aby przeczytać plik tekstowy, zapisać wynik do pliku wav.

    pozdrowienia

  4.   rzeka powiedział

    prawda jest bardzo zła, okna to inny świat ... tutaj są 10 lat wstecz

    1.    Raul powiedział

      A 3 lata później tak! to jest nadal spóźnione.