เครื่องมือรู้จำเสียงพูดที่ดีที่สุดสำหรับ Linux

เครื่องมือรู้จำเสียงที่ดีที่สุดสำหรับ Linux

นาทีที่ 2

Voice เป็นวิธีที่ใช้ในการโต้ตอบกับอุปกรณ์ของเรามากขึ้นเรื่อย ๆ นอกจากจะเป็นวิธีเดียวสำหรับผู้ที่ต้องการวิธีการเข้าถึงประเภทนี้ ไม่ว่าในกรณีใดการพูดเพื่อเขียนตามคำบอกหรือเพียงแค่ป้อนคำสั่งเสียงลงในระบบของเราเพื่อให้พวกเขาทำงานบางอย่างได้โดยไม่ต้องใช้มือ ปัญหาคือว่า การรับรู้เสียง พวกเขาใช้เครื่องมือที่ใช้อัลกอริทึมทางคณิตศาสตร์เพื่อจดจำเสียงพูดและไม่น่าเชื่อถือ 100%

ความก้าวหน้าทางเทคโนโลยีกำลังนำมาซึ่ง ความเชื่อถือได้ เพื่อความสมบูรณ์แบบนอกจากนี้ปัญญาประดิษฐ์และระบบข้อมูลขนาดใหญ่ยังช่วยปรับปรุงโปรแกรมการรู้จำเสียงได้อย่างมาก เมื่อไม่นานมานี้มีความพยายามมากมายในการปรับปรุงระบบเหล่านี้ให้ได้สูงสุดและการศึกษาจำนวนมากกำลังมุ่งเน้นไปที่ระบบนี้เพื่อปรับปรุงการควบคุมและทำให้เป็นส่วนต่อประสานของอนาคต โปรดทราบว่าอินเทอร์เฟซในปัจจุบันมีความเป็นธรรมชาติน้อยกว่าสำหรับผู้คนและมีความเร็วน้อยกว่าเสียง

ระบบจดจำเสียงจะมีมูลค่าประมาณ 10 หมื่นล้านดอลลาร์ในอีกไม่กี่ปีข้างหน้าและนั่นคือเหตุผลที่ บริษัท ขนาดใหญ่ให้ความสำคัญกับการพัฒนาผู้ช่วยเช่น Siri ของ Apple, Cortana ของ Microsoft หรือ Mycroft สำหรับ Linuxนอกเหนือจากการเป็นผลิตภัณฑ์ที่ได้รับความนิยมมากขึ้นเรื่อย ๆ เช่น Amazon Echo, Google Home หรือ Apple HomePod สำหรับบ้านรวมถึงการผสานรวมระบบจดจำเสียงที่ซับซ้อนในรถยนต์ที่เชื่อมต่อ

ที่กล่าวว่า " รายการเครื่องมือรู้จำเสียงสำหรับ Linux ของเรา เสียง:

จูเลียส: เป็นเครื่องมือจดจำเสียงพูดที่ทรงพลังอย่างต่อเนื่องพร้อมคำศัพท์มากมาย
คำพูดเชิงลึก: เป็นการนำ TensorFLow ไปใช้กับสถาปัตยกรรม DeepSpeech ของ Baidu
ไซมอน: ซอฟต์แวร์รู้จำเสียงที่ยืดหยุ่นพอสมควร
Kaldi: เป็นชุดเครื่องมือออกแบบ C ++ สำหรับการวิจัยการรู้จำเสียง
CMUSphinx: ในกรณีนี้เป็นเครื่องมือจดจำเสียงสำหรับแอพมือถือและเซิร์ฟเวอร์
deepspeech.python: เป็นการใช้งาน DeepSPeech กับ Python และใช้ Baidu Warp-CTC

แสดงความคิดเห็นของคุณ ยกเลิกการตอบ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

คิดเห็น *

ชื่อ*

จดหมายอิเล็กทรอนิกส์*

ฉันยอมรับ ข้อกำหนดความเป็นส่วนตัว*

รับผิดชอบข้อมูล: AB Internet Networks 2008 SL
วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

ฉันต้องการรับจดหมายข่าว

Miguel Angel dijo
มาแล้ว ปี 6

ดีมากและจะมี TTS (ข้อความเป็นคำพูด) ที่ดีสำหรับ linux หรือไม่?

ใน Windows และ Android มีเสียงที่มีคุณภาพดีมากเช่น Loquendo, Ivona หรือ NeoSpeech แต่ไม่ใช่สำหรับ Linux บน Linux ฉันลองใช้เสียง mbrola และ picoTTS แต่มันเป็นหุ่นยนต์มาก

Cepstral เสนอเสียงของ Alejandra ฟรีสำหรับ linux ซึ่งค่อนข้างดี แต่ฉันไม่รู้วิธีติดตั้ง

ตอบกลับ Miguel Angel
1. ราอูล dijo
  มาแล้ว ปี 6
  
  ฉันเดินไปในทางเดียวกันถ้าคุณได้รับส่วนแบ่งที่ดี
  
  ตอบกลับ rAUL
  1. อาร์มันโด dijo
    มาแล้ว ปี 6
    
    คุณสามารถใช้ loquendo กับไวน์บน linux ได้ ขอแนะนำวิดีโอนี้ ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    ตอบกลับ Armando
Nasher_87 (ARG) dijo
มาแล้ว ปี 6

ฉันพยายามติดตั้งผู้ช่วยฉันหมายถึง Google Assistant แต่ทำไม่ได้ฉันอยู่ในส่วนของไฟล์รีจิสตรีฉันคิดว่ามันถูกเรียก แย่จัง Alexa อึ ...

ตอบกลับ Nasher_87 (ARG)
Gerardo dijo
มาแล้ว ปี 6

โปรแกรม espeak ทำงานบนคอนโซล debian apt install espeak และเข้าร่วมเช่น espeak -ves « Hello World »

-ves คือ v = เสียงคือ = สเปน

คุณมีตัวเลือกมากมายในการอ่านไฟล์ข้อความเขียนผลลัพธ์ลงในไฟล์ wav

ความนับถือ

ตอบกลับ Gerardo
แม่น้ำ dijo
มาแล้ว ปี 6

ความจริงมันเลวร้ายมากหน้าต่างที่เป็นโลกอีกใบ ... นี่คือ 10 ปีที่ผ่านมา

ตอบกลับ raul
1. ราอูล dijo
  มาแล้ว ปี 2
  
  และอีก 3 ปีต่อมา ใช่! นี้ยังคงค้างชำระ
  
  ตอบกลับราอูล