เครื่องมือรู้จำเสียงที่ดีที่สุดสำหรับ Linux

พื้นหลังการจดจำเสียง

Voice เป็นวิธีที่ใช้ในการโต้ตอบกับอุปกรณ์ของเรามากขึ้นเรื่อย ๆ นอกจากจะเป็นวิธีเดียวสำหรับผู้ที่ต้องการวิธีการเข้าถึงประเภทนี้ ไม่ว่าในกรณีใดการพูดเพื่อเขียนตามคำบอกหรือเพียงแค่ป้อนคำสั่งเสียงลงในระบบของเราเพื่อให้พวกเขาทำงานบางอย่างได้โดยไม่ต้องใช้มือ ปัญหาคือว่า การรับรู้เสียง พวกเขาใช้เครื่องมือที่ใช้อัลกอริทึมทางคณิตศาสตร์เพื่อจดจำเสียงพูดและไม่น่าเชื่อถือ 100%

ความก้าวหน้าทางเทคโนโลยีกำลังนำมาซึ่ง ความเชื่อถือได้ เพื่อความสมบูรณ์แบบนอกจากนี้ปัญญาประดิษฐ์และระบบข้อมูลขนาดใหญ่ยังช่วยปรับปรุงโปรแกรมการรู้จำเสียงได้อย่างมาก เมื่อไม่นานมานี้มีความพยายามมากมายในการปรับปรุงระบบเหล่านี้ให้ได้สูงสุดและการศึกษาจำนวนมากกำลังมุ่งเน้นไปที่ระบบนี้เพื่อปรับปรุงการควบคุมและทำให้เป็นส่วนต่อประสานของอนาคต โปรดทราบว่าอินเทอร์เฟซในปัจจุบันมีความเป็นธรรมชาติน้อยกว่าสำหรับผู้คนและมีความเร็วน้อยกว่าเสียง

ระบบจดจำเสียงจะมีมูลค่าประมาณ 10 หมื่นล้านดอลลาร์ในอีกไม่กี่ปีข้างหน้าและนั่นคือเหตุผลที่ บริษัท ขนาดใหญ่ให้ความสำคัญกับการพัฒนาผู้ช่วยเช่น Siri ของ Apple, Cortana ของ Microsoft หรือ Mycroft สำหรับ Linuxนอกเหนือจากการเป็นผลิตภัณฑ์ที่ได้รับความนิยมมากขึ้นเรื่อย ๆ เช่น Amazon Echo, Google Home หรือ Apple HomePod สำหรับบ้านรวมถึงการผสานรวมระบบจดจำเสียงที่ซับซ้อนในรถยนต์ที่เชื่อมต่อ

ที่กล่าวว่า " รายการเครื่องมือรู้จำเสียงสำหรับ Linux ของเรา เสียง:

  • จูเลียส: เป็นเครื่องมือจดจำเสียงพูดที่ทรงพลังอย่างต่อเนื่องพร้อมคำศัพท์มากมาย
  • คำพูดเชิงลึก: เป็นการนำ TensorFLow ไปใช้กับสถาปัตยกรรม DeepSpeech ของ Baidu
  • ไซมอน: ซอฟต์แวร์รู้จำเสียงที่ยืดหยุ่นพอสมควร
  • Kaldi: เป็นชุดเครื่องมือออกแบบ C ++ สำหรับการวิจัยการรู้จำเสียง
  • CMUSphinx: ในกรณีนี้เป็นเครื่องมือจดจำเสียงสำหรับแอพมือถือและเซิร์ฟเวอร์
  • deepspeech.python: เป็นการใช้งาน DeepSPeech กับ Python และใช้ Baidu Warp-CTC

แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. รับผิดชอบข้อมูล: AB Internet Networks 2008 SL
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

  1.   Miguel Angel dijo

    ดีมากและจะมี TTS (ข้อความเป็นคำพูด) ที่ดีสำหรับ linux หรือไม่?

    ใน Windows และ Android มีเสียงที่มีคุณภาพดีมากเช่น Loquendo, Ivona หรือ NeoSpeech แต่ไม่ใช่สำหรับ Linux บน Linux ฉันลองใช้เสียง mbrola และ picoTTS แต่มันเป็นหุ่นยนต์มาก

    Cepstral เสนอเสียงของ Alejandra ฟรีสำหรับ linux ซึ่งค่อนข้างดี แต่ฉันไม่รู้วิธีติดตั้ง

    1.    ราอูล dijo

      ฉันเดินไปในทางเดียวกันถ้าคุณได้รับส่วนแบ่งที่ดี

      1.    อาร์มันโด dijo

        คุณสามารถใช้ loquendo กับไวน์บน linux ได้ ขอแนะนำวิดีโอนี้ ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    ฉันพยายามติดตั้งผู้ช่วยฉันหมายถึง Google Assistant แต่ทำไม่ได้ฉันอยู่ในส่วนของไฟล์รีจิสตรีฉันคิดว่ามันถูกเรียก แย่จัง Alexa อึ ...

  3.   Gerardo dijo

    โปรแกรม espeak ทำงานบนคอนโซล debian apt install espeak และเข้าร่วมเช่น espeak -ves « Hello World »

    -ves คือ v = เสียงคือ = สเปน

    คุณมีตัวเลือกมากมายในการอ่านไฟล์ข้อความเขียนผลลัพธ์ลงในไฟล์ wav

    ความนับถือ

  4.   แม่น้ำ dijo

    ความจริงมันเลวร้ายมากหน้าต่างที่เป็นโลกอีกใบ ... นี่คือ 10 ปีที่ผ่านมา

    1.    ราอูล dijo

      และอีก 3 ปีต่อมา ใช่! นี้ยังคงค้างชำระ