RHVoice ระบบสังเคราะห์เสียงพูดแบบเปิดมาในเวอร์ชัน 1.6.0

เมื่อเร็ว ๆ นี้ ประกาศเปิดตัวระบบสังเคราะห์เสียงพูดแบบเปิด RHVoice 1.6.0 เวอร์ชันใหม่ ซึ่งได้รับการพัฒนาในขั้นต้นเพื่อให้รองรับภาษารัสเซียคุณภาพสูง แต่ภายหลังได้ปรับให้เข้ากับภาษาอื่นๆ เช่น อังกฤษ โปรตุเกส ยูเครน คีร์กีซ ตาตาร์ และจอร์เจีย

สำหรับผู้ที่ไม่คุ้นเคยกับ RHVoice บอกเลยว่าโครงการนี้ ใช้การพัฒนาโครงการ HTS (ระบบสังเคราะห์เสียงพูดตาม HMM / DNN) และวิธีการสังเคราะห์แบบพาราเมตริกด้วยแบบจำลองทางสถิติ (การสังเคราะห์พารามิเตอร์ทางสถิติตาม HMM - โมเดลมาร์กอฟที่ซ่อนอยู่)

ข้อดีของแบบจำลองทางสถิติคือต้นทุนค่าโสหุ้ยต่ำและความต้องการพลังงาน CPU ต่ำ การดำเนินการทั้งหมดจะดำเนินการภายในระบบของผู้ใช้ รองรับคุณภาพเสียงสามระดับ (ยิ่งคุณภาพต่ำ ประสิทธิภาพยิ่งสูงขึ้น และเวลาตอบสนองสั้นลง)

ข้อเสียของแบบจำลองทางสถิติคือคุณภาพการออกเสียงที่ค่อนข้างต่ำ ซึ่งไม่ถึงระดับของซินธิไซเซอร์ที่สร้างคำพูดจากการผสมผสานของชิ้นส่วนคำพูดตามธรรมชาติ แต่อย่างไรก็ตาม ผลลัพธ์ที่ได้จะค่อนข้างชัดเจนและคล้ายกับการถ่ายทอดจากผู้พูด ในการเปรียบเทียบ โปรเจ็กต์ Silero ซึ่งให้กลไกเปิดสำหรับการสังเคราะห์เสียงพูดโดยอิงจากเทคโนโลยีการเรียนรู้ของเครื่องและชุดแบบจำลองสำหรับภาษารัสเซียนั้นมีคุณภาพเหนือกว่า RHVoice

มี 13 เสียงสำหรับภาษารัสเซียและเสียงถูกสร้างขึ้นบนพื้นฐานของการบันทึกเสียงที่เป็นธรรมชาติ. ในการตั้งค่า คุณสามารถเปลี่ยนความเร็ว ระดับเสียง และระดับเสียงได้

สามารถใช้ Sonic Library เพื่อเปลี่ยนจังหวะได้ เป็นไปได้ที่จะตรวจจับและเปลี่ยนภาษาโดยอัตโนมัติตามการวิเคราะห์ข้อความที่ป้อน (ตัวอย่างเช่น สำหรับคำและการอ้างอิงในภาษาอื่น สามารถใช้แบบจำลองการสังเคราะห์ดั้งเดิมของภาษาที่กำหนดได้) รองรับโปรไฟล์เสียง ซึ่งกำหนดการผสมเสียงสำหรับภาษาต่างๆ

รหัสนี้เขียนด้วย C ++ และเผยแพร่ภายใต้ลิขสิทธิ์ LGPL 2.1 นอกเหนือจากความจริงที่ว่าระบบรองรับ GNU / Linux, Windows และ Android โปรแกรมรองรับอินเทอร์เฟซ TTS (การแปลงข้อความเป็นคำพูด) ทั่วไปสำหรับการแปลงข้อความเป็นคำพูด: SAPI5 (Windows), Speech Dispatcher (GNU / Linux) และ Android Text-To-Speech API แต่ยังสามารถใช้บนหน้าจอ NVDA ได้อีกด้วย

RHVoice 1.6.0 คุณสมบัติใหม่ที่สำคัญ

ในระบบเวอร์ชันใหม่นี้ โดดเด่นเป็นความแปลกใหม่หลักที่ เพิ่มเสียงใหม่ 5 เสียงสำหรับการพูดภาษารัสเซีย นอกจากนี้ยังมีการสนับสนุนภาษาแอลเบเนีย

การเปลี่ยนแปลงอีกอย่างที่โดดเด่นในเวอร์ชันใหม่นี้คือ พจนานุกรมได้รับการปรับปรุงสำหรับภาษายูเครน และได้ขยายการสนับสนุนดังกล่าวเพื่อแสดงอักขระอีโมจิ

อีกทั้งยังเน้นย้ำถึงผลงานที่e ทำในการแก้ไขข้อผิดพลาดในแอปพลิเคชันของแพลตฟอร์ม Android การนำเข้าพจนานุกรมที่กำหนดเองทำให้ง่ายขึ้นและเพิ่มการรองรับสำหรับแพลตฟอร์ม Android 11 แล้ว

ในทางกลับกัน เรายังพบว่ามีการเพิ่มการกำหนดค่าและฟังก์ชันการทำงานใหม่ๆ ให้กับแกนหลักของเอ็นจิ้น ซึ่งรวมถึง g2p.case, word_break และความเข้ากันได้กับตัวกรองอีควอไลเซอร์

สุดท้ายนี้ หากคุณสนใจทราบข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันใหม่นี้ เข้าไปดูรายละเอียดได้ที่ ในลิงค์ต่อไปนี้.

ดาวน์โหลด RHVoice

สำหรับการผู้สนใจสามารถดาวน์โหลดระบบนี้ได้ สำหรับการสังเคราะห์เสียง คุณสามารถรับแพ็คเกจการติดตั้งจาก ลิงค์ต่อไปนี้

ยังได้กล่าวถึงในประกาศฉบับใหม่นี้ว่า สำหรับผู้ใช้ Android ที่ติดตั้ง RHVoice ไว้ในอุปกรณ์ของคุณแล้ว สิ่งนี้จะอัปเดตโดยอัตโนมัติ หากเปิดใช้งานการอัปเดตอัตโนมัติ ดังนั้นจึงไม่จำเป็นต้องดำเนินการด้วยตนเอง

ในกรณีที่ปิดใช้งานการอัปเดตและคุณต้องการให้มีเวอร์ชันใหม่ คุณสามารถเปิดใช้งานฟังก์ชันการค้นหาการอัปเดตได้ด้วยตนเอง

ทันทีที่ RHVoice ที่อัปเดตทำงานอีกครั้ง จะพยายามดาวน์โหลดข้อมูลภาษาใหม่ เมื่อข้อมูลใหม่ถูกดาวน์โหลด RHVoice จะเริ่มใช้งาน


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. รับผิดชอบข้อมูล: AB Internet Networks 2008 SL
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา