Μετατροπή κειμένου σε ομιλία. Μερικές εναλλακτικές λύσεις για Linux

Μετατροπή κειμένου σε ομιλία

Για διάφορους λόγους? αναπηρία, επιθυμία εκμετάλλευσης του ταξιδιού ή της αναμονής στο χρόνο ή, απλώς από προσωπικές προτιμήσεις, τη δυνατότητα που μας δίνουν οι υπολογιστές Η μετατροπή κειμένου σε ήχο, είτε διαβάζοντάς το είτε μετατρέποντάς το σε αρχείο για να το ακούσετε αργότερα, είναι μια ευρέως χρησιμοποιούμενη δυνατότητα.

Τα Windows και το Android έχουν εγγενή δυνατότητα ανάγνωσης με φωνές που, αν και διατηρούν ορισμένα χαρακτηριστικά που συνεχίζουν να προσδιορίζουν την τεχνητή προέλευσή τους, εντούτοις είναι ευχάριστα στο αυτί.

Σε αυτό προστίθεται μια σειρά δωρεάν και επί πληρωμή προγράμματα που αξιοποιούν στο έπακρο αυτές τις δυνατότητες.

Αφού θυμηθούμε ότι τα Windows πληρώνονται και το Android συλλέγει δεδομένα για την Google, πρέπει να πούμε τιΤο Linux δεν είναι ακόμα στο σημείο, ωστόσο, μπορούμε να καταφέρουμε να επιτύχουμε βατά αποτελέσματα. Από την άλλη πλευρά, αν και υπάρχουν επιλογές για εμπορικού βαθμού Linux (και, φυσικά, πρέπει να πληρώσετε) σε αυτό το άρθρο θα επικεντρωθούμε σε δωρεάν και ανοιχτού κώδικα επιλογές.

Εργαλεία για τη μετατροπή κειμένου σε ομιλία

Λόγος-Διανομέας

Εάν χρησιμοποιείτε το πρόγραμμα προβολής e-book Caliber, θα δείτε ότι στο Linux σας ζητά να εγκαταστήσετε ένα πακέτο που ονομάζεται Speech-DispatcherΤο Αυτός ο δαίμονας συστήματος λειτουργεί ως σύνδεσμος μεταξύ των προγραμμάτων που θέλουν να μετατρέψουν κείμενο σε λόγο και των προγραμμάτων που χειρίζονται τη σύνθεση ομιλίας.

Από τα προγράμματα που συζητούνται σε αυτό το άρθρο συνεργάζεται με το Espeak και το Festival.

Είναι μια εφαρμογή που βρίσκεται στα αποθετήρια, ώστε να μπορείτε να την αναζητήσετε κατά όνομα για να την εγκαταστήσετε από τον διαχειριστή πακέτων.

Espeak / Espeak NG

Για να δοκιμάσετε τις ακόλουθες εντολές, θα χρειαστεί να δημιουργήσετε ένα αρχείο κειμένου, να γράψετε κάτι και να το αποθηκεύσετε ως test.txt

Το Espeak είναι ένα βοηθητικό πρόγραμμα μετατροπής κειμένου σε ομιλία που χρησιμοποιείται από τα εργαλεία ανάγνωσης οθόνης πολλών διανομών Linux ώστε να μπορείτε να το εγκαταστήσετε από τα αποθετήρια του. Χρησιμοποιείται τόσο από τη γραμμή εντολών όσο και μέσω προγραμμάτων με γραφική διεπαφή όπως το Gespeaker ή το Kmouth (αμφότερα σε αποθετήρια).

Οι περισσότερες από τις διαθέσιμες φωνές στο Espeak ακούγονται ρομποτικές, αλλά, είναι αρκετά καλά κατανοητές και, δεν υπάρχει περιορισμός στη χρήση τους.

Το Espeak NG είναι μια πιο συμπαγής έκδοση του προηγούμενου.

Για να μετατρέψετε ένα αρχείο από κείμενο σε ομιλία
Ισπανικά από την Ισπανία
espeak -f prueba.txt -v es -w prueba.wav

Λατινικής Αμερικής Ισπανικά
espeak -f prueba.txt -v es-419 -w prueba.wav

Βοήθεια και περισσότερες πληροφορίες
man espeak

Φεστιβάλ

Ένα άλλο εργαλείο που διατίθεται στα αποθετήρια είναι το Festival. Περιλαμβάνει τα ίδια χαρακτηριστικά των δύο προηγούμενων, εκτός από τη δυνατότητα ανάγνωσης αυτών που γράφουμε.

Μπορούμε να δούμε τη λίστα των γλωσσών που έχουν εγκατασταθεί με:
ls /usr/share/festival/languages/

Διαβάστε ένα αρχείο
festival --language castillian_spanish --tts prueba.txt
Μάθετε περισσότερα
man festival
Η προεπιλεγμένη φωνή στα ισπανικά είναι καθαρή, αν και ρομποτική, αλλά έχει προβλήματα με τους διφθόγγους. Το Φεστιβάλ δεν δημιουργεί αρχεία ήχου.

Μηχανή κειμένου σε ομιλία Pico

Είναι ο συνθέτης ομιλίας της έκδοσης ανοιχτού κώδικα του Android. Η φωνή είναι πολύ πιο φυσική, αν και θέτει περιορισμούς στο μήκος του κειμένου. Μπορείτε να το βρείτε στα αποθετήρια με το όνομα ibttspico-utils.

Για να μετατρέψουμε από αρχείο κειμένου σε φωνητικό αρχείο χρησιμοποιούμε την εντολή:
pico2wave -l es-ES -w prueba.wav "$(cat prueba.txt)"

Μπορούμε να βρούμε περισσότερες πληροφορίες γράφοντας:
pico2wave - βοήθεια

gTTS

Αυτή η εφαρμογή χρησιμοποιεί την ίδια βιβλιοθήκη που χρησιμοποιεί το Google Translate για να δείξει την προφορά μιας λέξης. Παρόλο που βρίσκεται στα αποθετήρια, μπορεί να είναι επειδή είναι μια παλιά έκδοση, δεν μπορεί να επικοινωνήσει με τους διακομιστές της Google, οπότε είναι καλύτερο να το εγκαταστήσετε από τα αποθετήρια PyPy.org

Για αυτό πρέπει να βεβαιωθούμε ότι έχουμε εγκατεστημένο το πακέτο python3-pip και στη συνέχεια να γράψουμε:

sudo pip3 install gTTS

Στη συνέχεια κάνουμε τα εξής:

sudo nano ~/.profile

Και προσθέτουμε αυτήν τη γραμμή

export PATH="$HOME/.local/bin:$PATH"

Εξοικονομούμε με CTRL και σώζουμε με  CTRLX

Μπορούμε να δούμε τις διαθέσιμες γλώσσες πληκτρολογώντας

gtts-cli --all

Για να μετατρέψουμε (σε αυτήν την περίπτωση σε mp3) ένα αρχείο κειμένου, κάνουμε:

gtts-cli -f prueba.txt --l es --output test.mp3

Η Google θέτει όρια στη χρήση που μπορούμε να κάνουμε στο πρόγραμμα, αλλά μπόρεσα να δημιουργήσω αρχεία έως και μία ώρα.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: AB Internet Networks 2008 SL
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.