Най-добрите инструменти за разпознаване на реч за Linux

Фон за гласово разпознаване

Гласът все повече се използва за взаимодействие с нашите устройства, освен че е единственият метод за тези, които се нуждаят от този тип методи за достъпност. Във всеки случай е доста удобно да говорите, за да диктувате текст или просто да въвеждате гласови команди в нашите системи, така че те да извършват някаква операция, без да използват ръцете си. Проблемът е в това разпознаване на реч те се основават на двигатели, които използват математически алгоритми за разпознаване на речта и не са 100% надеждни.

Технологичният напредък все повече донася надеждност до съвършенство, а изкуственият интелект и системите за големи данни също помагат изключително много за подобряване на програмите за разпознаване на реч. Напоследък се полагат много усилия за подобряване на тези системи до максимум и много изследвания се фокусират върху него, за да подобрят контрола и да ги направят интерфейс на бъдещето. Имайте предвид, че настоящите интерфейси са по-малко естествени за хората и по-малко бързи от гласовите.

Системите за разпознаване на глас ще имат стойност от около 10 милиарда долара през следващите години и затова големите компании се фокусират върху разработването на асистенти като Siri на Apple, Cortana на Microsoft или Mycroft за Linux, освен че стават все по-популярни и чести продукти като Amazon Echo, Google Home или Apple HomePod за дома, както и интегриране на сложни системи за разпознаване на глас в свързани автомобили.

Това каза, нашия списък с инструменти за разпознаване на реч за Linux звук:

  • Julius: е мощен двигател за непрекъснато разпознаване на реч с много речник.
  • DeepSpeech: е изпълнение на TensorFLow на архитектурата DeepSpeech на Baidu.
  • Саймън: доста гъвкав софтуер за разпознаване на реч.
  • Калди: е инструментариум за проектиране на C ++ за изследване на разпознаване на реч.
  • CMUSфинкс: в този случай това е двигател за разпознаване на глас за мобилни приложения и сървъри.
  • deepspeech.python: е изпълнение на DeepSPeech с Python и използване на Baidu Warp-CTC.

Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорник за данните: AB Internet Networks 2008 SL
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.

  1.   Miguel Angel каза той

    Много добре и ще има ли някакъв добър TTS (текст в реч) за linux?

    В Windows и Android има много качествени гласове като Loquendo, Ivona или NeoSpeech, но те не са за Linux. На Linux опитах гласовете mbrola и picoTTS, но те са много роботизирани.

    Cepstral предлага безплатен глас Alejandra за linux, който е доста добър, но не знаех как да го инсталирам.

    1.    РАУЛ каза той

      Влизам в същото, ако получите добър дял

      1.    Армандо каза той

        Можете да използвате loquendo с вино на linux. Препоръчвам това видео ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) каза той

    Опитах се да инсталирам асистент, имам предвид Google Assistant и не можах, останах в частта от файла на системния регистър, мисля, че се нарича. Жалко, че Алекса е глупост ...

  3.   Херардо каза той

    Програмата espeak работи на debian apt install espeak конзола. И се присъединете например към espeak -ves «Hello World»

    -ves е v = гласовете е = испански

    Имате много опции за четене на текстов файл, запис на резултата във wav файл.

    поздрави

  4.   Раул каза той

    истината е много лоша, прозорци, това е друг свят ... ето те изостават с 10 години

    1.    Раул каза той

      И 3 години по-късно, да! това все още е просрочено.