Voice semakin menjadi metode yang digunakan untuk berinteraksi dengan perangkat kami, selain menjadi satu-satunya metode bagi mereka yang membutuhkan jenis metode aksesibilitas ini. Bagaimanapun, cukup nyaman untuk berbicara untuk mendiktekan teks atau cukup memasukkan perintah suara ke dalam sistem kami sehingga mereka melakukan beberapa jenis operasi tanpa menggunakan tangan mereka. Masalahnya adalah pengenalan suara mereka didasarkan pada mesin yang menggunakan algoritme matematika untuk mengenali ucapan dan tidak 100% dapat diandalkan.
Kemajuan teknologi semakin menghadirkan keandalan menuju kesempurnaan, dan kecerdasan buatan serta sistem data besar juga sangat membantu meningkatkan program pengenalan ucapan. Akhir-akhir ini banyak upaya dilakukan untuk meningkatkan sistem ini secara maksimal, dan banyak penelitian yang berfokus padanya untuk meningkatkan kontrol dan menjadikannya antarmuka masa depan. Ingatlah bahwa antarmuka saat ini kurang alami untuk orang-orang dan kurang cepat daripada suara.
Sistem pengenalan suara akan memiliki nilai sekitar 10 miliar dolar di tahun-tahun mendatang dan itulah sebabnya perusahaan besar berfokus pada pengembangan asisten seperti Siri Apple, Cortana Microsoft atau Mycroft untuk Linux, selain menjadi produk yang semakin populer dan sering digunakan seperti Amazon Echo, Google Home, atau Apple HomePod untuk rumah, serta mengintegrasikan sistem pengenalan suara yang canggih di mobil yang terhubung.
Itu berkata, daftar alat pengenalan suara kami untuk Linux suara:
- Julius: adalah mesin pengenalan ucapan berkelanjutan yang kuat dengan banyak kosakata.
- Pidato Dalam: adalah implementasi TensorFLow dari arsitektur DeepSpeech Baidu.
- Simon: perangkat lunak pengenalan suara yang cukup fleksibel.
- kaldi: adalah perangkat desain C ++ untuk penelitian pengenalan suara.
- CMUSphinx: dalam hal ini adalah mesin pengenalan suara untuk aplikasi dan server seluler.
- pidato mendalam.python: adalah implementasi DeepSPeech dengan Python dan menggunakan Baidu Warp-CTC.
Sangat bagus, dan akankah ada TTS (text to speech) yang bagus untuk linux?
Di Windows dan Android ada suara dengan kualitas yang sangat bagus seperti Loquendo, Ivona atau NeoSpeech, tetapi mereka bukan untuk Linux. Di Linux saya mencoba suara mbrola dan picoTTS tetapi mereka sangat robotik.
Cepstral menawarkan suara Alejandra gratis untuk linux yang cukup bagus, tetapi saya tidak tahu cara menginstalnya.
Saya berjalan di tempat yang sama jika Anda mendapat bagian yang bagus
Anda dapat menggunakan loquendo dengan anggur di linux. Saya merekomendasikan video ini ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Saya mencoba menginstal asisten, maksud saya, Asisten Google dan saya tidak bisa, saya tetap berada di bagian file registri, saya pikir itu namanya. Sayang sekali Alexa adalah omong kosong ...
Program espeak bekerja pada debian apt install konsol espeak. Dan bergabunglah misalnya espeak -ves «Hello World»
the -ves adalah v = voices is = Spanish
Anda memiliki banyak pilihan untuk membaca file teks, menulis hasilnya ke file wav.
salam
kebenaran semuanya sangat buruk, jendela itu adalah dunia lain ... di sini mereka 10 tahun di belakang
Dan 3 tahun kemudian, ya! ini masih terlambat.