Alat pengenalan suara terbaik untuk Linux

Latar belakang pengenalan suara

Voice semakin menjadi metode yang digunakan untuk berinteraksi dengan perangkat kami, selain menjadi satu-satunya metode bagi mereka yang membutuhkan jenis metode aksesibilitas ini. Bagaimanapun, cukup nyaman untuk berbicara untuk mendiktekan teks atau cukup memasukkan perintah suara ke dalam sistem kami sehingga mereka melakukan beberapa jenis operasi tanpa menggunakan tangan mereka. Masalahnya adalah pengenalan suara mereka didasarkan pada mesin yang menggunakan algoritme matematika untuk mengenali ucapan dan tidak 100% dapat diandalkan.

Kemajuan teknologi semakin menghadirkan keandalan menuju kesempurnaan, dan kecerdasan buatan serta sistem data besar juga sangat membantu meningkatkan program pengenalan ucapan. Akhir-akhir ini banyak upaya dilakukan untuk meningkatkan sistem ini secara maksimal, dan banyak penelitian yang berfokus padanya untuk meningkatkan kontrol dan menjadikannya antarmuka masa depan. Ingatlah bahwa antarmuka saat ini kurang alami untuk orang-orang dan kurang cepat daripada suara.

Sistem pengenalan suara akan memiliki nilai sekitar 10 miliar dolar di tahun-tahun mendatang dan itulah sebabnya perusahaan besar berfokus pada pengembangan asisten seperti Siri Apple, Cortana Microsoft atau Mycroft untuk Linux, selain menjadi produk yang semakin populer dan sering digunakan seperti Amazon Echo, Google Home, atau Apple HomePod untuk rumah, serta mengintegrasikan sistem pengenalan suara yang canggih di mobil yang terhubung.

Itu berkata, daftar alat pengenalan suara kami untuk Linux suara:

  • Julius: adalah mesin pengenalan ucapan berkelanjutan yang kuat dengan banyak kosakata.
  • Pidato Dalam: adalah implementasi TensorFLow dari arsitektur DeepSpeech Baidu.
  • Simon: perangkat lunak pengenalan suara yang cukup fleksibel.
  • kaldi: adalah perangkat desain C ++ untuk penelitian pengenalan suara.
  • CMUSphinx: dalam hal ini adalah mesin pengenalan suara untuk aplikasi dan server seluler.
  • pidato mendalam.python: adalah implementasi DeepSPeech dengan Python dan menggunakan Baidu Warp-CTC.

tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Bertanggung jawab atas data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.

  1.   Miguel Angel dijo

    Sangat bagus, dan akankah ada TTS (text to speech) yang bagus untuk linux?

    Di Windows dan Android ada suara dengan kualitas yang sangat bagus seperti Loquendo, Ivona atau NeoSpeech, tetapi mereka bukan untuk Linux. Di Linux saya mencoba suara mbrola dan picoTTS tetapi mereka sangat robotik.

    Cepstral menawarkan suara Alejandra gratis untuk linux yang cukup bagus, tetapi saya tidak tahu cara menginstalnya.

    1.    RAUL dijo

      Saya berjalan di tempat yang sama jika Anda mendapat bagian yang bagus

      1.    Armando dijo

        Anda dapat menggunakan loquendo dengan anggur di linux. Saya merekomendasikan video ini ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Saya mencoba menginstal asisten, maksud saya, Asisten Google dan saya tidak bisa, saya tetap berada di bagian file registri, saya pikir itu namanya. Sayang sekali Alexa adalah omong kosong ...

  3.   Gerardo dijo

    Program espeak bekerja pada debian apt install konsol espeak. Dan bergabunglah misalnya espeak -ves «Hello World»

    the -ves adalah v = voices is = Spanish

    Anda memiliki banyak pilihan untuk membaca file teks, menulis hasilnya ke file wav.

    salam

  4.   sungai dijo

    kebenaran semuanya sangat buruk, jendela itu adalah dunia lain ... di sini mereka 10 tahun di belakang

    1.    Raul dijo

      Dan 3 tahun kemudian, ya! ini masih terlambat.