Suara semakin menjadi kaedah yang digunakan untuk berinteraksi dengan peranti kami, selain menjadi satu-satunya kaedah bagi mereka yang memerlukan kaedah kebolehaksesan jenis ini. Walau bagaimanapun, cukup selesa untuk bercakap untuk menentukan teks atau memasukkan perintah suara ke dalam sistem kami sehingga mereka melakukan semacam operasi tanpa menggunakan tangan mereka. Masalahnya ialah pengiktirafan suara mereka didasarkan pada mesin yang menggunakan algoritma matematik untuk mengenali pertuturan dan tidak 100% dipercayai.
Kemajuan teknologi semakin membawa kebolehpercayaan hingga sempurna, dan kecerdasan buatan dan sistem data besar juga banyak membantu meningkatkan program pengecaman pertuturan. Akhir-akhir ini banyak usaha dilakukan untuk memperbaiki sistem ini secara maksimal, dan banyak kajian memfokuskannya untuk meningkatkan kontrol dan menjadikannya sebagai antarmuka masa depan. Perlu diingat bahawa antara muka semasa kurang semula jadi bagi orang dan kurang pantas daripada suara.
Sistem pengecaman suara akan mempunyai nilai sekitar 10 bilion dolar pada tahun-tahun mendatang dan itulah sebabnya syarikat besar memfokuskan diri pada pengembangan pembantu seperti Siri Apple, Microsoft Cortana atau Mycroft untuk Linux, selain menjadi produk yang semakin popular dan kerap seperti Amazon Echo, Google Home, atau Apple HomePod untuk kediaman, serta mengintegrasikan sistem pengecaman suara yang canggih di dalam kereta yang bersambung.
Telah berkata bahawa, senarai alat pengecaman pertuturan kami untuk Linux bunyi:
- Julius: adalah mesin pengecam pertuturan berterusan yang kuat dengan banyak perbendaharaan kata.
- Ucapan Dalam: adalah pelaksanaan TensorFLow dari seni bina DeepSpeech Baidu.
- Simon: perisian pengecaman pertuturan yang cukup fleksibel.
- kaldi: adalah alat reka bentuk C ++ untuk penyelidikan pengecaman pertuturan.
- CMUSphinx: dalam kes ini, ia adalah mesin pengecam suara untuk aplikasi dan pelayan mudah alih.
- deepspeech.python: adalah pelaksanaan DeepSPeech dengan Python dan menggunakan Baidu Warp-CTC.
Sangat bagus, dan adakah TTS yang baik (teks ke ucapan) untuk linux?
Di Windows dan Android terdapat suara berkualiti sangat baik seperti Loquendo, Ivona atau NeoSpeech, tetapi ia bukan untuk Linux. Di Linux saya mencuba suara mbrola dan picoTTS tetapi sangat robot.
Cepstral menawarkan suara Alejandra percuma untuk linux yang cukup bagus, tetapi saya tidak tahu cara memasangnya.
Saya berjalan sama jika anda mendapat bahagian yang baik
Anda boleh menggunakan loquendo dengan wain di linux. Saya mengesyorkan video ini ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Saya cuba memasang pembantu, maksudnya, Pembantu Google dan saya tidak dapat, saya tinggal di bahagian fail pendaftaran, saya rasa ia dipanggil. Sayang sekali Alexa omong kosong ...
Program espeak berfungsi pada debian apt memasang konsol espeak. Dan sertai misalnya espeak -ves «Hello World»
the -ves is v = suara adalah = Sepanyol
Anda mempunyai banyak pilihan untuk membaca fail teks, menulis hasilnya ke fail wav.
salam
sebenarnya semuanya sangat buruk, tingkap yang lain adalah dunia ... di sini mereka 10 tahun di belakang
Dan 3 tahun kemudian, ya! ini masih tertunggak.