Các công cụ nhận dạng giọng nói tốt nhất cho Linux

Nền nhận dạng giọng nói

Giọng nói ngày càng được sử dụng để tương tác với các thiết bị của chúng tôi, ngoài ra còn là phương pháp duy nhất cho những người cần loại phương pháp trợ năng này. Trong mọi trường hợp, thật thoải mái khi nói để đọc chính tả văn bản hoặc chỉ cần nhập khẩu lệnh vào hệ thống của chúng tôi để chúng thực hiện một số thao tác mà không cần sử dụng tay. Vấn đề là ở đó nhận dạng giọng nói chúng dựa trên các công cụ sử dụng các thuật toán toán học để nhận dạng giọng nói và không đáng tin cậy 100%.

Những tiến bộ công nghệ ngày càng mang lại độ tin cậy để hoàn thiện và trí tuệ nhân tạo và hệ thống dữ liệu lớn cũng đang giúp cải thiện rất nhiều các chương trình nhận dạng giọng nói. Gần đây, nhiều nỗ lực đang được thực hiện để cải thiện các hệ thống này ở mức tối đa, và nhiều nghiên cứu đang tập trung vào nó để cải thiện khả năng kiểm soát và biến chúng trở thành giao diện của tương lai. Hãy nhớ rằng các giao diện hiện tại kém tự nhiên hơn đối với mọi người và kém nhanh hơn giọng nói.

Hệ thống nhận dạng giọng nói sẽ có giá trị khoảng 10 tỷ đô la trong những năm tới và đó là lý do tại sao các công ty lớn đang tập trung vào sự phát triển của các trợ lý như Siri của Apple, Cortana của Microsoft hoặc Mycroft dành cho Linux, ngoài việc các sản phẩm ngày càng trở nên phổ biến và thường xuyên như Amazon Echo, Google Home hoặc Apple HomePod cho gia đình, cũng như tích hợp hệ thống nhận dạng giọng nói tinh vi trong ô tô được kết nối.

Điều đó nói rằng, danh sách các công cụ nhận dạng giọng nói của chúng tôi dành cho Linux âm thanh:

  • Julius: là một công cụ nhận dạng giọng nói liên tục mạnh mẽ với rất nhiều từ vựng.
  • Bài phát biểu sâu sắc: là một triển khai TensorFLow của kiến ​​trúc DeepSpeech của Baidu.
  • Simon: một phần mềm nhận dạng giọng nói khá linh hoạt.
  • kaldi: là một bộ công cụ thiết kế C ++ để nghiên cứu nhận dạng giọng nói.
  • CMUSnhân sư: trong trường hợp này, nó là công cụ nhận dạng giọng nói cho các ứng dụng và máy chủ di động.
  • deepspeech.python: là một triển khai của DeepSPboards bằng Python và sử dụng Baidu Warp-CTC.

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   Thiên thần Miguel dijo

    Rất tốt, và sẽ có bất kỳ TTS (văn bản thành lời nói) nào tốt cho linux?

    Trong Windows và Android có những giọng nói chất lượng rất tốt như Loquendo, Ivona hay NeoSpeech, nhưng chúng không dành cho Linux. Trên Linux, tôi đã thử giọng nói của mbrola và picoTTS nhưng chúng rất giống robot.

    Cepstral cung cấp giọng nói Alejandra miễn phí cho linux, khá tốt, nhưng tôi không biết cách cài đặt nó.

    1.    RAUL dijo

      Tôi sẽ bước vào cùng nếu bạn nhận được một chia sẻ tốt

      1.    Armando dijo

        Bạn có thể sử dụng loquendo với rượu trên linux. Tôi giới thiệu video này ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Tôi đã cố gắng cài đặt một trợ lý, ý tôi là, Trợ lý Google và tôi không thể, tôi vẫn ở trong phần của tệp đăng ký, tôi nghĩ nó được gọi là. Thật tệ là Alexa thật là tào lao ...

  3.   Gerardo dijo

    Chương trình espeak hoạt động trên bảng điều khiển espeak debian apt install. Và tham gia ví dụ espeak -ves «Hello World»

    -ves là v = giọng nói là = tiếng Tây Ban Nha

    Bạn có nhiều tùy chọn để đọc một tệp văn bản, ghi kết quả vào tệp wav.

    Liên quan

  4.   sông dijo

    sự thật là tất cả rất tồi tệ, cửa sổ là một thế giới khác ... ở đây chúng đã chậm hơn 10 năm

    1.    Raul dijo

      Và 3 năm sau, vâng! điều này vẫn còn quá hạn.