RHVoice, el sistema de síntesis de voz abierto llega a su version 1.6.0

Hace poco se dio a conocer el lanzamiento de la nueva version del sistema de síntesis de voz abierto RHVoice 1.6.0, el cual fue inicialmente desarrollado para proporcionar soporte de alta calidad para el idioma ruso, pero luego adaptado para otros idiomas, incluidos inglés, portugués, ucraniano, kirguís, tártaro y georgiano.

Para quienes desconocen de RHVoice, les puedo decir que este proyecto utiliza los desarrollos del proyecto HTS (Sistema de Síntesis de Voz basado en HMM / DNN) y un método de síntesis paramétrica con modelos estadísticos (Síntesis Paramétrica Estadística basada en HMM – Modelo Oculto de Markov).

Las ventajas del modelo estadístico son los bajos costos generales y la baja demanda de energía de la CPU. Todas las operaciones se realizan localmente en el sistema del usuario. Se admiten tres niveles de calidad de voz (cuanto menor es la calidad, mayor es el rendimiento y menor es el tiempo de respuesta).

La desventaja del modelo estadístico es la calidad relativamente baja de la pronunciación, que no alcanza el nivel de los sintetizadores que generan el habla a partir de una combinación de fragmentos de habla natural, pero sin embargo el resultado es bastante legible y se asemeja a una emisión desde un altavoz. A modo de comparación, el proyecto Silero, que proporciona un motor abierto para la síntesis de voz basado en tecnologías de aprendizaje automático y un conjunto de modelos para el idioma ruso, es superior en calidad a RHVoice.

Hay 13 voces disponibles para el idioma ruso y las voces se forman sobre la base de grabaciones de voz natural. En la configuración, puede cambiar la velocidad, el tono y el volumen.

La biblioteca de Sonic se puede utilizar para cambiar el tempo . Es posible detectar y cambiar automáticamente el idioma basándose en el análisis del texto de entrada (por ejemplo, para palabras y citas en otro idioma, se puede utilizar el modelo de síntesis nativo del idioma dado). Se admiten perfiles de voz, que definen combinaciones de voz para diferentes idiomas.

El código está escrito en C++ y se distribuye bajo la licencia LGPL 2.1, ademas de que el sistema es admitido en GNU/Linux, Windows y Android. El programa es compatible con las interfaces típicas TTS (texto a voz) para convertir texto a voz: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) y API de Android Text-To-Speech, pero también se puede utilizar en la pantalla NVDA.

Principales novedades de RHVoice 1.6.0

En esta nueva version del sistema se destaca como novedad principal que se agregan 5 nuevas voces para el habla rusa, ademas de que se ha implementado el apoyo al idioma albanés.

Otro de los cambios que se destaca de esta nueva version es que el diccionario fue actualizado para el idioma ucraniano y que el soporte se ha ampliado para expresar caracteres emoji.

Tambien se destaca el trabajo que se realizó en la corrección de errores en la aplicación de la plataforma Android, se simplificó la importación de diccionarios personalizados y se agregó el soporte para la plataforma Android 11.

Por otra parte, tambien podremos encontrar que se agregaron nuevas configuraciones y funcionalidades al núcleo del motor, incluidos g2p.case, word_break y compatibilidad con filtros de ecualización.

Finalmente si estás interesado en poder conocer más al respecto de esta nueva version, puedes consultar los detalles en el siguiente enlace.

Descargar RHVoice

Para aquellos que estén interesados en poder descargar este sistema de síntesis de voz, pueden obtener los paquetes de instalación desde el siguiente enlace.

Ademas se menciona en el anuncio de esta nueva version que para los usuarios de Android que cuenten con RHVoice ya está instalado en su dispositivo, este se actualizará automáticamente, si las actualizaciones automáticas están habilitadas, por lo que no hau necesidad de tener que hacer el proceso manualmente.

En el caso de tener las actualizaciones deshabilitadas y quieren tener la nueva version pueden activar la funcion de buscar actualizaciones manualmente.

Tan pronto como la RHVoice actualizada se ejecute de nuevo, intentará descargar los datos del nuevo idioma. Cuando se descargan los nuevos datos, RHVoice comenzará a usarlos.


El contenido del artículo se adhiere a nuestros principios de ética editorial. Para notificar un error pincha aquí.

Sé el primero en comentar

Deja tu comentario

Tu dirección de correo electrónico no será publicada.

*

*

  1. Responsable de los datos: AB Internet Networks 2008 SL
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.