Google abre dos importantes sistemas

Google Speech logo

Google es una compañía que se caracteriza por tener gran cantidad de proyectos de código abierto. Pero recientemente ha hecho unos movimientos muy interesantes para la comunidad open-source, y es abrir dos de sus grandes proyectos. Estos tienen relación con Android, pero ambos son bastante diferentes el uno del otro. Ahora estarán disponibles desde GitHub para todos desde hace unas semanas…

El primer proyecto del que hablamos es el motor de voz para Live Transcribe, una interesante herramienta de reconocimiento de voz y transcripción de voz a texto para Android. Se basa en algoritmos de aprendizaje automático para transformar audio en subtítulos en tiempo real. Si lo piensas bien, no solo es importante de cara a la comunidad, también para mejorar la accesibilidad de sistemas Linux, ya que no es un aspecto del que tengamos que estar extremadamente orgullosos y se podría hacer mucho más.

Por otro lado, Google también ha abierto otro de sus sistemas de software. Y es el de seguimiento de gestos para Android. Este tipo de proyectos no son muy frecuentes entre los que ya hay disponibles de código abierto, por eso es una grata noticia. Disponer de este código permitirá a los desarrolladores crear mejores sistemas apoyándose en ellos. Y, vuelvo a repetir, es algo importante para mejorar la accesibilidad o ciertos aspectos no demasiado cuidados en sistemas operativos de código abierto, aunque en Android sí que se ha mejorado este aspecto bastante…

En este segundo sistema liberado, el de seguimiento de gestos, está construido sobre un framework de aprendizaje automático MediaPiple. Este software combina tres componentes de inteligencia artificial: un detector de palma, un modelo que devuelve puntos de la mano en 3D, y un reconocedor de gestos. De esta forma se mejorará la experiencia en gran variedad de dominios y plataformas tecnológicas.

Github – reconocimiento de voz

Github – reconocimiento de gestos

Un comentario, deja el tuyo

  1.   jano dijo

    Ojalá alguien se interese en desarrollar algo con el live translator. Quienes trabajamos con entrevistas y ese tipo de cosas se lo agradecerán eternamente!!

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.