Giọng nói ngày càng được sử dụng để tương tác với các thiết bị của chúng tôi, ngoài ra còn là phương pháp duy nhất cho những người cần loại phương pháp trợ năng này. Trong mọi trường hợp, thật thoải mái khi nói để đọc chính tả văn bản hoặc chỉ cần nhập khẩu lệnh vào hệ thống của chúng tôi để chúng thực hiện một số thao tác mà không cần sử dụng tay. Vấn đề là ở đó nhận dạng giọng nói chúng dựa trên các công cụ sử dụng các thuật toán toán học để nhận dạng giọng nói và không đáng tin cậy 100%.
Những tiến bộ công nghệ ngày càng mang lại độ tin cậy để hoàn thiện và trí tuệ nhân tạo và hệ thống dữ liệu lớn cũng đang giúp cải thiện rất nhiều các chương trình nhận dạng giọng nói. Gần đây, nhiều nỗ lực đang được thực hiện để cải thiện các hệ thống này ở mức tối đa, và nhiều nghiên cứu đang tập trung vào nó để cải thiện khả năng kiểm soát và biến chúng trở thành giao diện của tương lai. Hãy nhớ rằng các giao diện hiện tại kém tự nhiên hơn đối với mọi người và kém nhanh hơn giọng nói.
Hệ thống nhận dạng giọng nói sẽ có giá trị khoảng 10 tỷ đô la trong những năm tới và đó là lý do tại sao các công ty lớn đang tập trung vào sự phát triển của các trợ lý như Siri của Apple, Cortana của Microsoft hoặc Mycroft dành cho Linux, ngoài việc các sản phẩm ngày càng trở nên phổ biến và thường xuyên như Amazon Echo, Google Home hoặc Apple HomePod cho gia đình, cũng như tích hợp hệ thống nhận dạng giọng nói tinh vi trong ô tô được kết nối.
Điều đó nói rằng, danh sách các công cụ nhận dạng giọng nói của chúng tôi dành cho Linux âm thanh:
- Julius: là một công cụ nhận dạng giọng nói liên tục mạnh mẽ với rất nhiều từ vựng.
- Bài phát biểu sâu sắc: là một triển khai TensorFLow của kiến trúc DeepSpeech của Baidu.
- Simon: một phần mềm nhận dạng giọng nói khá linh hoạt.
- kaldi: là một bộ công cụ thiết kế C ++ để nghiên cứu nhận dạng giọng nói.
- CMUSnhân sư: trong trường hợp này, nó là công cụ nhận dạng giọng nói cho các ứng dụng và máy chủ di động.
- deepspeech.python: là một triển khai của DeepSPboards bằng Python và sử dụng Baidu Warp-CTC.
Rất tốt, và sẽ có bất kỳ TTS (văn bản thành lời nói) nào tốt cho linux?
Trong Windows và Android có những giọng nói chất lượng rất tốt như Loquendo, Ivona hay NeoSpeech, nhưng chúng không dành cho Linux. Trên Linux, tôi đã thử giọng nói của mbrola và picoTTS nhưng chúng rất giống robot.
Cepstral cung cấp giọng nói Alejandra miễn phí cho linux, khá tốt, nhưng tôi không biết cách cài đặt nó.
Tôi sẽ bước vào cùng nếu bạn nhận được một chia sẻ tốt
Bạn có thể sử dụng loquendo với rượu trên linux. Tôi giới thiệu video này ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Tôi đã cố gắng cài đặt một trợ lý, ý tôi là, Trợ lý Google và tôi không thể, tôi vẫn ở trong phần của tệp đăng ký, tôi nghĩ nó được gọi là. Thật tệ là Alexa thật là tào lao ...
Chương trình espeak hoạt động trên bảng điều khiển espeak debian apt install. Và tham gia ví dụ espeak -ves «Hello World»
-ves là v = giọng nói là = tiếng Tây Ban Nha
Bạn có nhiều tùy chọn để đọc một tệp văn bản, ghi kết quả vào tệp wav.
Liên quan
sự thật là tất cả rất tồi tệ, cửa sổ là một thế giới khác ... ở đây chúng đã chậm hơn 10 năm
Và 3 năm sau, vâng! điều này vẫn còn quá hạn.