Głos jest coraz częściej używany do interakcji z naszymi urządzeniami, będąc jedyną metodą dla tych, którzy potrzebują tego typu metod dostępności. W każdym razie wygodnie jest mówić, dyktować tekst lub po prostu wprowadzać polecenia głosowe do naszych systemów, aby wykonywać jakąś operację bez użycia rąk. Problemem jest rozpoznawanie głosu są one oparte na silnikach, które wykorzystują algorytmy matematyczne do rozpoznawania mowy i nie są w 100% niezawodne.
Postęp technologiczny w coraz większym stopniu powoduje, że niezawodność do perfekcji, a sztuczna inteligencja i systemy dużych zbiorów danych również bardzo pomagają w ulepszaniu programów rozpoznawania mowy. Ostatnio podejmuje się wiele wysiłków, aby ulepszyć te systemy do maksimum, a wiele badań koncentruje się na tym, aby poprawić sterowanie i uczynić z nich interfejs przyszłości. Pamiętaj, że obecne interfejsy są mniej naturalne dla ludzi i wolniejsze niż głos.
Systemy rozpoznawania głosu będą miały w najbliższych latach wartość około 10 miliardów dolarów i właśnie dlatego duże firmy koncentrują się na rozwoju asystentów, takich jak Siri firmy Apple, Cortana firmy Microsoft czy Mycroft dla systemu Linux, oprócz tego, że stają się coraz bardziej popularne i częste produkty, takie jak Amazon Echo, Google Home czy Apple HomePod do użytku domowego, a także integrują zaawansowane systemy rozpoznawania głosu w połączonych samochodach.
To powiedziawszy nasza lista narzędzi do rozpoznawania mowy dla systemu Linux dźwięk:
- Julius: to potężny silnik do ciągłego rozpoznawania mowy z dużą ilością słownictwa.
- Głęboka mowa: to implementacja TensorFLow architektury DeepSpeech firmy Baidu.
- Szymon, Szymek: dość elastyczne oprogramowanie do rozpoznawania mowy.
- Kaldi: to zestaw narzędzi projektowych C ++ do badań nad rozpoznawaniem mowy.
- CMUSfinks: w tym przypadku jest to silnik rozpoznawania głosu dla aplikacji mobilnych i serwerów.
- deepspeech.python: to implementacja DeepSPeech z Pythonem i korzystająca z Baidu Warp-CTC.
Bardzo dobrze i czy będzie dobry TTS (zamiana tekstu na mowę) dla Linuksa?
W systemie Windows i Android są bardzo dobrej jakości głosy, takie jak Loquendo, Ivona czy NeoSpeech, ale nie są one przeznaczone dla Linuksa. W Linuksie wypróbowałem głosy mbrola i picoTTS, ale są one bardzo automatyczne.
Cepstral oferuje darmowy głos Alejandry dla Linuksa, który jest całkiem niezły, ale nie wiedziałem, jak go zainstalować.
Wchodzę tak samo, jeśli dostaniesz dobry udział
Możesz używać loquendo z winem na Linuksie. Polecam ten film ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Próbowałem zainstalować asystenta, to znaczy Asystenta Google i nie mogłem, zostałem w części pliku rejestru, myślę, że to się nazywa. Szkoda, że Alexa to gówno ...
Program espeak działa na konsoli debian apt install espeak. I dołącz na przykład espeak -ves «Hello World»
-ves to v = voices to = hiszpański
Masz wiele opcji, aby przeczytać plik tekstowy, zapisać wynik do pliku wav.
pozdrowienia
prawda jest bardzo zła, okna to inny świat ... tutaj są 10 lat wstecz
A 3 lata później tak! to jest nadal spóźnione.