Các công cụ nhận dạng giọng nói tốt nhất cho Linux

2 phút

Giọng nói ngày càng được sử dụng để tương tác với các thiết bị của chúng tôi, ngoài ra còn là phương pháp duy nhất cho những người cần loại phương pháp trợ năng này. Trong mọi trường hợp, thật thoải mái khi nói để đọc chính tả văn bản hoặc chỉ cần nhập khẩu lệnh vào hệ thống của chúng tôi để chúng thực hiện một số thao tác mà không cần sử dụng tay. Vấn đề là ở đó nhận dạng giọng nói chúng dựa trên các công cụ sử dụng các thuật toán toán học để nhận dạng giọng nói và không đáng tin cậy 100%.

Những tiến bộ công nghệ ngày càng mang lại độ tin cậy để hoàn thiện và trí tuệ nhân tạo và hệ thống dữ liệu lớn cũng đang giúp cải thiện rất nhiều các chương trình nhận dạng giọng nói. Gần đây, nhiều nỗ lực đang được thực hiện để cải thiện các hệ thống này ở mức tối đa, và nhiều nghiên cứu đang tập trung vào nó để cải thiện khả năng kiểm soát và biến chúng trở thành giao diện của tương lai. Hãy nhớ rằng các giao diện hiện tại kém tự nhiên hơn đối với mọi người và kém nhanh hơn giọng nói.

Hệ thống nhận dạng giọng nói sẽ có giá trị khoảng 10 tỷ đô la trong những năm tới và đó là lý do tại sao các công ty lớn đang tập trung vào sự phát triển của các trợ lý như Siri của Apple, Cortana của Microsoft hoặc Mycroft dành cho Linux, ngoài việc các sản phẩm ngày càng trở nên phổ biến và thường xuyên như Amazon Echo, Google Home hoặc Apple HomePod cho gia đình, cũng như tích hợp hệ thống nhận dạng giọng nói tinh vi trong ô tô được kết nối.

Điều đó nói rằng, danh sách các công cụ nhận dạng giọng nói của chúng tôi dành cho Linux âm thanh:

Julius: là một công cụ nhận dạng giọng nói liên tục mạnh mẽ với rất nhiều từ vựng.
Bài phát biểu sâu sắc: là một triển khai TensorFLow của kiến trúc DeepSpeech của Baidu.
Simon: một phần mềm nhận dạng giọng nói khá linh hoạt.
kaldi: là một bộ công cụ thiết kế C ++ để nghiên cứu nhận dạng giọng nói.
CMUSnhân sư: trong trường hợp này, nó là công cụ nhận dạng giọng nói cho các ứng dụng và máy chủ di động.
deepspeech.python: là một triển khai của DeepSPboards bằng Python và sử dụng Baidu Warp-CTC.

Để lại bình luận của bạn Hủy trả lời

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

chú thích *

tên*

thư điện tử*

Tôi chấp nhận điều khoản riêng tư*

Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
Hợp pháp: Sự đồng ý của bạn
Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

Tôi muốn nhận bản tin

Thiên thần Miguel dijo
trước 6 năm

Rất tốt, và sẽ có bất kỳ TTS (văn bản thành lời nói) nào tốt cho linux?

Trong Windows và Android có những giọng nói chất lượng rất tốt như Loquendo, Ivona hay NeoSpeech, nhưng chúng không dành cho Linux. Trên Linux, tôi đã thử giọng nói của mbrola và picoTTS nhưng chúng rất giống robot.

Cepstral cung cấp giọng nói Alejandra miễn phí cho linux, khá tốt, nhưng tôi không biết cách cài đặt nó.

Trả lời Miguel Angel
1. RAUL dijo
  trước 6 năm
  
  Tôi sẽ bước vào cùng nếu bạn nhận được một chia sẻ tốt
  
  Trả lời rAUL
  1. Armando dijo
    trước 6 năm
    
    Bạn có thể sử dụng loquendo với rượu trên linux. Tôi giới thiệu video này ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    Trả lời Armando
Nasher_87 (ARG) dijo
trước 6 năm

Tôi đã cố gắng cài đặt một trợ lý, ý tôi là, Trợ lý Google và tôi không thể, tôi vẫn ở trong phần của tệp đăng ký, tôi nghĩ nó được gọi là. Thật tệ là Alexa thật là tào lao ...

Trả lời Nasher_87 (ARG)
Gerardo dijo
trước 6 năm

Chương trình espeak hoạt động trên bảng điều khiển espeak debian apt install. Và tham gia ví dụ espeak -ves «Hello World»

-ves là v = giọng nói là = tiếng Tây Ban Nha

Bạn có nhiều tùy chọn để đọc một tệp văn bản, ghi kết quả vào tệp wav.

Liên quan

Trả lời Gerardo
sông dijo
trước 6 năm

sự thật là tất cả rất tồi tệ, cửa sổ là một thế giới khác ... ở đây chúng đã chậm hơn 10 năm

Trả lời raul
1. Raul dijo
  trước 2 năm
  
  Và 3 năm sau, vâng! điều này vẫn còn quá hạn.
  
  Trả lời Raul