Найкращі засоби розпізнавання мови для Linux

Фон розпізнавання голосу

Голос все частіше стає методом взаємодії з нашими пристроями, крім того, що він є єдиним методом для тих, хто потребує цього типу методів доступності. У будь-якому випадку досить зручно говорити, щоб диктувати текст, або просто вводити голосові команди в наші системи, щоб вони виконували якусь операцію, не використовуючи рук. Проблема в тому розпізнавання мови вони засновані на механізмах, які використовують математичні алгоритми для розпізнавання мови і не є 100% надійними.

Технологічний прогрес все більше приносить надійність до досконалості, а штучний інтелект та системи великих даних також дуже допомагають вдосконалити програми розпізнавання мови. Останнім часом докладається багато зусиль для вдосконалення цих систем до максимуму, і багато досліджень зосереджено на ньому, щоб поліпшити управління та зробити їх інтерфейсом майбутнього. Майте на увазі, що поточні інтерфейси менш природні для людей і менш швидкі, ніж голосові.

Системи розпізнавання голосу матимуть вартість у найближчі роки близько 10 мільярдів доларів, і тому великі компанії зосереджуються на розробці таких помічників, як Siri від Apple, Cortana від Microsoft або Mycroft для Linux, крім того, що вони стають все популярнішими та частішими продуктами, такими як Amazon Echo, Google Home або Apple HomePod для дому, а також інтегрують складні системи розпізнавання голосу в підключених автомобілях.

Що сказав наш список інструментів розпізнавання мови для Linux звук:

  • Юлій: це потужний механізм безперервного розпізнавання мови з великим словниковим запасом.
  • DeepSpeech: є реалізацією TensorFLow архітектури DeepSpeech від Baidu.
  • Саймон: досить гнучка програма розпізнавання мови.
  • Калді: є набором інструментів для розробки розпізнавання мовлення на C ++.
  • CMUSphinx: у цьому випадку це механізм розпізнавання голосу для мобільних додатків та серверів.
  • deepspeech.python: є реалізацією DeepSPeech з Python та використанням Baidu Warp-CTC.

Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: AB Internet Networks 2008 SL
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.

  1.   Мігель Анхель - сказав він

    Дуже добре, і чи буде якийсь хороший TTS (перетворення тексту в мову) для Linux?

    У Windows та Android є дуже якісні голоси, такі як Loquendo, Ivona або NeoSpeech, але вони не для Linux. У Linux я спробував голоси mbrola та picoTTS, але вони дуже роботизовані.

    Cepstral пропонує безкоштовний голос Алехандри для Linux, що цілком непогано, але я не знав, як його встановити.

    1.    РАУЛЬ - сказав він

      Я гуляю тим самим, якщо ви отримуєте хорошу частку

      1.    Armando - сказав він

        Ви можете використовувати loquendo з вином на Linux. Я рекомендую це відео ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) - сказав він

    Я спробував встановити помічника, я маю на увазі Google Assistant, і я не зміг, я залишився в тій частині файлу реєстру, я думаю, що він називається. Шкода, що Алекса - це лайно ...

  3.   Херардо - сказав він

    Програма espeak працює на консолі espeak debian apt install. І приєднайтеся, наприклад, до espeak -ves «Hello World»

    -ves - це v = голоси є = іспанська

    У вас є багато варіантів прочитати текстовий файл, записати результат у wav-файл.

    привіт

  4.   Рауль - сказав він

    правда все дуже погано, вікна - це інший світ ... ось вони на 10 років позаду

    1.    Рауль - сказав він

      А через 3 роки так! це все ще прострочене.