Τα καλύτερα εργαλεία αναγνώρισης ομιλίας για Linux

Φόντο φωνητικής αναγνώρισης

Το Voice είναι όλο και περισσότερο μια μέθοδος που χρησιμοποιείται για την αλληλεπίδραση με τις συσκευές μας, εκτός από το ότι είναι η μόνη μέθοδος για όσους χρειάζονται αυτόν τον τύπο μεθόδων προσβασιμότητας. Σε κάθε περίπτωση, είναι αρκετά άνετο να μιλάτε για να υπαγορεύετε κείμενο ή απλά να εισάγετε φωνητικές εντολές στα συστήματά μας, ώστε να κάνουν κάποιο είδος λειτουργίας χωρίς να χρησιμοποιούν τα χέρια τους. Το πρόβλημα είναι ότι αναγνώριση ομιλίας βασίζονται σε μηχανές που χρησιμοποιούν μαθηματικούς αλγόριθμους για την αναγνώριση ομιλίας και δεν είναι 100% αξιόπιστοι.

Οι τεχνολογικές εξελίξεις φέρνουν όλο και περισσότερο το αξιοπιστία στην τελειότητα, και η τεχνητή νοημοσύνη και τα μεγάλα συστήματα δεδομένων βοηθούν επίσης πολύ στη βελτίωση των προγραμμάτων αναγνώρισης ομιλίας. Τον τελευταίο καιρό καταβάλλονται πολλές προσπάθειες για τη βελτίωση αυτών των συστημάτων στο μέγιστο, και πολλές μελέτες επικεντρώνονται σε αυτό για τη βελτίωση του ελέγχου και τη μετατροπή τους στο μέλλον. Λάβετε υπόψη ότι οι τρέχουσες διεπαφές είναι λιγότερο φυσικές για τους ανθρώπους και λιγότερο γρήγορες από τη φωνή.

Τα συστήματα αναγνώρισης φωνής θα έχουν αξία περίπου 10 δισεκατομμυρίων δολαρίων τα επόμενα χρόνια και αυτός είναι ο λόγος για τον οποίο μεγάλες εταιρείες επικεντρώνονται στην ανάπτυξη βοηθών όπως το Siri της Apple, το Cortana της Microsoft ή Mycroft για Linux, εκτός από το ότι γίνεται όλο και πιο δημοφιλές και συχνό προϊόν όπως το Amazon Echo, το Google Home ή το Apple HomePod για το σπίτι, καθώς και η ενσωμάτωση εξελιγμένων συστημάτων αναγνώρισης φωνής σε συνδεδεμένα αυτοκίνητα.

Ωστόσο, η λίστα των εργαλείων αναγνώρισης ομιλίας για Linux ήχου:

  • Ιούλιος: είναι μια ισχυρή μηχανή συνεχούς αναγνώρισης ομιλίας με άφθονο λεξιλόγιο.
  • Βαθιά ομιλία: είναι μια εφαρμογή TensorFLow της αρχιτεκτονικής DeepSpeech του Baidu.
  • Simon: ένα αρκετά ευέλικτο λογισμικό αναγνώρισης ομιλίας.
  • Κάλντι: είναι μια εργαλειοθήκη σχεδιασμού C ++ για έρευνα αναγνώρισης ομιλίας.
  • CMUSphinx: σε αυτήν την περίπτωση είναι μια μηχανή αναγνώρισης φωνής για εφαρμογές και διακομιστές για κινητά.
  • βαθύς λόγος.python: είναι μια εφαρμογή του DeepSPeech με την Python και τη χρήση του Baidu Warp-CTC.

Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: AB Internet Networks 2008 SL
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.

  1.   Miguel Angel dijo

    Πολύ καλό και θα υπάρχει καλό TTS (κείμενο σε ομιλία) για το linux;

    Στα Windows και στο Android υπάρχουν πολύ καλής ποιότητας φωνές όπως το Loquendo, το Ivona ή το NeoSpeech, αλλά δεν είναι για Linux. Στο Linux δοκίμασα τις φωνές mbrola και picoTTS αλλά είναι πολύ ρομποτικές.

    Η Cepstral προσφέρει δωρεάν τη φωνή του Alejandra για linux που είναι αρκετά καλή, αλλά δεν ήξερα πώς να το εγκαταστήσω.

    1.    ΡΑΟΥΛ dijo

      Περπατώ στο ίδιο αν έχετε ένα καλό μερίδιο

      1.    Armando dijo

        Μπορείτε να χρησιμοποιήσετε το loquendo με κρασί στο linux. Προτείνω αυτό το βίντεο ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Προσπάθησα να εγκαταστήσω έναν βοηθό, εννοώ, ο Βοηθός Google και δεν μπορούσα, έμεινα στο μέρος του αρχείου μητρώου, νομίζω ότι ονομάζεται. Πολύ κακό Alexa είναι χάλια ...

  3.   Gerardo dijo

    Το πρόγραμμα espeak λειτουργεί στο debian apt install κονσόλα espeak. Και εγγραφείτε για παράδειγμα espeak -ves «Hello World»

    το -ves είναι v = φωνές είναι = Ισπανικά

    Έχετε πολλές επιλογές για να διαβάσετε ένα αρχείο κειμένου, να γράψετε το αποτέλεσμα σε ένα αρχείο wav.

    αφορά

  4.   ποτάμι dijo

    η αλήθεια είναι πολύ κακή, παράθυρα που είναι ένας άλλος κόσμος ... εδώ είναι 10 χρόνια πίσω

    1.    Ραούλ dijo

      Και 3 χρόνια μετά, ναι! αυτό είναι ακόμη καθυστερημένο.