Najlepsze narzędzia do rozpoznawania mowy dla systemu Linux

2 minut

Głos jest coraz częściej używany do interakcji z naszymi urządzeniami, będąc jedyną metodą dla tych, którzy potrzebują tego typu metod dostępności. W każdym razie wygodnie jest mówić, dyktować tekst lub po prostu wprowadzać polecenia głosowe do naszych systemów, aby wykonywać jakąś operację bez użycia rąk. Problemem jest rozpoznawanie głosu są one oparte na silnikach, które wykorzystują algorytmy matematyczne do rozpoznawania mowy i nie są w 100% niezawodne.

Postęp technologiczny w coraz większym stopniu powoduje, że niezawodność do perfekcji, a sztuczna inteligencja i systemy dużych zbiorów danych również bardzo pomagają w ulepszaniu programów rozpoznawania mowy. Ostatnio podejmuje się wiele wysiłków, aby ulepszyć te systemy do maksimum, a wiele badań koncentruje się na tym, aby poprawić sterowanie i uczynić z nich interfejs przyszłości. Pamiętaj, że obecne interfejsy są mniej naturalne dla ludzi i wolniejsze niż głos.

Systemy rozpoznawania głosu będą miały w najbliższych latach wartość około 10 miliardów dolarów i właśnie dlatego duże firmy koncentrują się na rozwoju asystentów, takich jak Siri firmy Apple, Cortana firmy Microsoft czy Mycroft dla systemu Linux, oprócz tego, że stają się coraz bardziej popularne i częste produkty, takie jak Amazon Echo, Google Home czy Apple HomePod do użytku domowego, a także integrują zaawansowane systemy rozpoznawania głosu w połączonych samochodach.

To powiedziawszy nasza lista narzędzi do rozpoznawania mowy dla systemu Linux dźwięk:

Julius: to potężny silnik do ciągłego rozpoznawania mowy z dużą ilością słownictwa.
Głęboka mowa: to implementacja TensorFLow architektury DeepSpeech firmy Baidu.
Szymon, Szymek: dość elastyczne oprogramowanie do rozpoznawania mowy.
Kaldi: to zestaw narzędzi projektowych C ++ do badań nad rozpoznawaniem mowy.
CMUSfinks: w tym przypadku jest to silnik rozpoznawania głosu dla aplikacji mobilnych i serwerów.
deepspeech.python: to implementacja DeepSPeech z Pythonem i korzystająca z Baidu Warp-CTC.

Zostaw swój komentarz Anuluj odpowiedź

Miguel Angel powiedział
temu 6 roku

Bardzo dobrze i czy będzie dobry TTS (zamiana tekstu na mowę) dla Linuksa?

W systemie Windows i Android są bardzo dobrej jakości głosy, takie jak Loquendo, Ivona czy NeoSpeech, ale nie są one przeznaczone dla Linuksa. W Linuksie wypróbowałem głosy mbrola i picoTTS, ale są one bardzo automatyczne.

Cepstral oferuje darmowy głos Alejandry dla Linuksa, który jest całkiem niezły, ale nie wiedziałem, jak go zainstalować.

Odpowiedz Miguel Angel
1. RAUL powiedział
  temu 6 roku
  
  Wchodzę tak samo, jeśli dostaniesz dobry udział
  
  Odpowiedz rAUL
  1. Armando powiedział
    temu 6 roku
    
    Możesz używać loquendo z winem na Linuksie. Polecam ten film ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    Odpowiedz Armando
Nasher_87 (ARG) powiedział
temu 6 roku

Próbowałem zainstalować asystenta, to znaczy Asystenta Google i nie mogłem, zostałem w części pliku rejestru, myślę, że to się nazywa. Szkoda, że Alexa to gówno ...

Odpowiedz na Nasher_87 (ARG)
Gerardo powiedział
temu 6 roku

Program espeak działa na konsoli debian apt install espeak. I dołącz na przykład espeak -ves «Hello World»

-ves to v = voices to = hiszpański

Masz wiele opcji, aby przeczytać plik tekstowy, zapisać wynik do pliku wav.

pozdrowienia

Odpowiedz Gerardo
rzeka powiedział
temu 6 roku

prawda jest bardzo zła, okna to inny świat ... tutaj są 10 lat wstecz

Odpowiedz raul
1. Raul powiedział
  temu 2 roku
  
  A 3 lata później tak! to jest nadal spóźnione.
  
  Odpowiedz Raul