Swara saya akeh digunakake kanggo sesambungan karo piranti kita, saliyane dadi siji-sijine cara kanggo wong-wong sing butuh metode aksesibilitas jinis iki. Ing kasus apa wae, cukup kepenak kanggo ngomongake kanggo ndhikte teks utawa mung ngetik perintah swara menyang sistem kita supaya bisa nindakake operasi tanpa nggunakake tangan. Masalahe yaiku pangenalan swara adhedhasar mesin sing nggunakake algoritma matématika kanggo ngenali wicara lan ora dipercaya 100%.
Kemajuan teknologi tambah akeh linuwih kanggo kesempurnaan, lan intelijen buatan lan sistem data gedhe uga ngrewangi nambah program pangenalan pidato kanthi gedhe. Akhir-akhir iki akeh upaya sing ditindakake kanggo ningkatake sistem kasebut kanthi maksimal, lan akeh panaliten sing fokus kanggo nambah kontrol lan nggawe antarmuka ing mangsa ngarep. Elinga yen antarmuka saiki kurang alami kanggo wong lan kurang cepet tinimbang swara.
Sistem pangenal swara bakal duwe regane udakara 10 milyar dolar ing taun-taun mbesuk lan mulane perusahaan-perusahaan gedhe fokus marang pangembangan asisten kayata Siri Apple, Cortana Microsoft utawa Mycroft kanggo Linux, saliyane dadi produk sing saya populer lan asring kayata Amazon Echo, Google Home, utawa Apple HomePod kanggo omah, uga nggabungake sistem pangenal swara sing canggih ing mobil sing gegandhengan.
Sing ngomong, dhaptar alat pangenalan pidato kanggo Linux Padha:
- Julius: yaiku mesin pangenalan ucapan sing terus-terusan kanthi akeh kosa kata.
- DeepSpeech: minangka implementasi TensorFLow arsitektur DeepSpeech Baidu.
- Simon: piranti lunak pangenalan wicara sing cukup fleksibel.
- kaldi: minangka toolkit desain C ++ kanggo riset pangenalan ucapan.
- CMUSphinx: ing kasus iki minangka mesin pangenal swara kanggo aplikasi seluler lan server.
- deepspeech.python: yaiku implementasi DeepSPeech karo Python lan nggunakake Baidu Warp-CTC.
7 komentar, tinggalake sampeyan
Apik banget, lan apa bakal ana TTS (teks kanggo wicara) sing apik kanggo linux?
Ing Windows lan Android ana swara sing apik banget kayata Loquendo, Ivona utawa NeoSpeech, nanging ora kanggo Linux. Ing Linux, aku nyoba swara mbrola lan picoTTS nanging robot-robot kasebut.
Cepstral nawakake swara Alejandra gratis kanggo linux sing cukup apik, nanging aku ora ngerti cara nginstal.
Aku mlaku kanthi padha yen sampeyan entuk bagean sing apik
Sampeyan bisa nggunakake loquendo karo anggur ing linux. Aku nyaranake video iki ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Aku nyoba nginstal asisten, maksudku, Asisten Google lan aku ora bisa, aku tetep ana ing bagean saka file registri, dak kira wis disebut. Alexa ala banget ...
Program espeak bisa digunakake ing debian apt nginstal espeak console. Lan gabung contone espeak -ves «Hello World»
the -ves is v = voices is = Spanyol
Sampeyan duwe akeh pilihan kanggo maca file teks, nulis asile menyang file wav.
regards
kasunyatane kabeh banget ala, windows sing ana jagad liyane ... ing ngisor iki isih ana 10 taun
Lan 3 taun sabanjure, ya! iki isih telat.