Chuyển văn bản thành giọng nói. Một số lựa chọn thay thế cho Linux

Chuyển văn bản thành giọng nói

Vì nhiều lý do; khuyết tật, mong muốn tận dụng thời gian đi du lịch hoặc chờ đợi, hoặc đơn giản là do sở thích cá nhân, khả năng mà máy tính mang lại cho chúng ta Chuyển đổi văn bản thành âm thanh, bằng cách đọc hoặc chuyển đổi thành tệp để nghe sau này, là một tính năng được sử dụng rộng rãi.

Windows và Android nguyên bản có khả năng đọc với giọng nói, mặc dù chúng vẫn giữ một số đặc điểm tiếp tục xác định nguồn gốc nhân tạo của chúng, tuy nhiên vẫn dễ chịu đối với tai.

Thêm vào đó là một loạt các chương trình miễn phí và trả phí tận dụng tối đa các tính năng này.

Sau khi nhớ rằng Windows trả phí và Android thu thập dữ liệu cho Google, chúng ta phải nói những gìMặc dù vậy, e Linux vẫn chưa đạt mức ngang bằng, chúng ta có thể xoay sở để đạt được kết quả khả quan. Mặt khác, mặc dù có các tùy chọn cho Linux cấp thương mại (và tất nhiên, bạn phải trả phí) trong bài viết này, chúng tôi sẽ tập trung vào các tùy chọn mã nguồn mở và miễn phí.

Công cụ chuyển văn bản thành giọng nói

Người điều phối giọng nói

Nếu bạn sử dụng trình xem sách điện tử Calibre, bạn sẽ thấy rằng trong Linux, nó yêu cầu bạn cài đặt một gói có tên là Speech-Dispatcher. Daemon hệ thống này hoạt động như một liên kết giữa các chương trình muốn chuyển văn bản thành giọng nói và các chương trình xử lý tổng hợp giọng nói.

Trong số các chương trình được thảo luận trong bài viết này hoạt động với Espeak và Festival.

Nó là một ứng dụng nằm trong kho lưu trữ, do đó bạn có thể tìm kiếm nó theo tên để cài đặt nó từ trình quản lý gói.

Espeak / Espeak NG

Để kiểm tra các lệnh sau, bạn sẽ cần tạo một tệp văn bản, viết một cái gì đó và lưu nó dưới dạng test.txt

Espeak là một tiện ích chuyển văn bản thành giọng nói được sử dụng bởi các công cụ đọc màn hình của nhiều bản phân phối Linux vì vậy bạn có thể cài đặt nó từ kho của nó. Nó được sử dụng cả từ dòng lệnh và thông qua các chương trình có giao diện đồ họa như Gespeaker hoặc Kmouth (cả hai đều trong kho lưu trữ).

Hầu hết các giọng nói có sẵn trong robot âm thanh Espeak, nhưng, chúng được hiểu khá rõ và không có giới hạn cho việc sử dụng chúng.

Espeak NG là một phiên bản nhỏ gọn hơn của phiên bản trước.

Để chuyển đổi một tệp từ văn bản thành giọng nói
Tiếng Tây Ban Nha từ Tây Ban Nha
espeak -f prueba.txt -v es -w prueba.wav

Tiếng Tây Ban Nha Mỹ Latinh
espeak -f prueba.txt -v es-419 -w prueba.wav

Trợ giúp và thêm thông tin
man espeak

Lễ hội

Một công cụ khác có sẵn trong kho là Festival. Nó bao gồm các đặc điểm giống nhau của hai phần trước, ngoài khả năng đọc được những gì chúng ta đang viết.

Chúng tôi có thể xem danh sách các ngôn ngữ được cài đặt với:
ls /usr/share/festival/languages/

Đọc một tập tin
festival --language castillian_spanish --tts prueba.txt
thêm thông tin
man festival
Giọng nói mặc định bằng tiếng Tây Ban Nha rõ ràng, mặc dù là tiếng rô bốt, nhưng có vấn đề với âm đôi. Festival không tạo ra các tệp âm thanh.

Công cụ chuyển văn bản thành giọng nói của Pico

Nó là bộ tổng hợp giọng nói của phiên bản mã nguồn mở của Android. Giọng nói tự nhiên hơn nhiều, mặc dù nó đặt ra những hạn chế về độ dài của văn bản. Bạn có thể tìm thấy nó trong kho dưới tên ibttspico-utils.

Để chuyển đổi từ văn bản sang tệp thoại, chúng ta sử dụng lệnh:
pico2wave -l es-ES -w prueba.wav "$(cat prueba.txt)"

Chúng tôi có thể tìm thêm thông tin bằng cách viết:
pico2wave --help

gTTS

Ứng dụng này sử dụng cùng một thư viện mà Google Dịch sử dụng để thể hiện cách phát âm của một từ. Mặc dù nó nằm trong kho lưu trữ nhưng có thể do là phiên bản cũ nên nó không thể giao tiếp với máy chủ Google nên tốt hơn là bạn nên cài đặt nó từ kho lưu trữ PyPy.org

Đối với điều này, chúng tôi phải đảm bảo rằng chúng tôi đã cài đặt gói python3-pip và sau đó viết:

sudo pip3 install gTTS

Sau đó, chúng tôi làm như sau:

sudo nano ~/.profile

Và chúng tôi thêm dòng này

export PATH="$HOME/.local/bin:$PATH"

Chúng tôi tiết kiệm với CTRL HOẶC và chúng tôi tiếp tục với  CTRLX

Chúng tôi có thể xem các ngôn ngữ có sẵn bằng cách nhập

gtts-cli --all

Để chuyển đổi (trong trường hợp này là mp3) một tệp văn bản, chúng tôi thực hiện:

gtts-cli -f prueba.txt --l es --output test.mp3

Google đặt ra các giới hạn về việc sử dụng chương trình mà chúng tôi có thể thực hiện, nhưng tôi đã có thể tạo các tệp có thời lượng lên đến một giờ.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.