Гласът все повече се използва за взаимодействие с нашите устройства, освен че е единственият метод за тези, които се нуждаят от този тип методи за достъпност. Във всеки случай е доста удобно да говорите, за да диктувате текст или просто да въвеждате гласови команди в нашите системи, така че те да извършват някаква операция, без да използват ръцете си. Проблемът е в това разпознаване на реч те се основават на двигатели, които използват математически алгоритми за разпознаване на речта и не са 100% надеждни.
Технологичният напредък все повече донася надеждност до съвършенство, а изкуственият интелект и системите за големи данни също помагат изключително много за подобряване на програмите за разпознаване на реч. Напоследък се полагат много усилия за подобряване на тези системи до максимум и много изследвания се фокусират върху него, за да подобрят контрола и да ги направят интерфейс на бъдещето. Имайте предвид, че настоящите интерфейси са по-малко естествени за хората и по-малко бързи от гласовите.
Системите за разпознаване на глас ще имат стойност от около 10 милиарда долара през следващите години и затова големите компании се фокусират върху разработването на асистенти като Siri на Apple, Cortana на Microsoft или Mycroft за Linux, освен че стават все по-популярни и чести продукти като Amazon Echo, Google Home или Apple HomePod за дома, както и интегриране на сложни системи за разпознаване на глас в свързани автомобили.
Това каза, нашия списък с инструменти за разпознаване на реч за Linux звук:
- Julius: е мощен двигател за непрекъснато разпознаване на реч с много речник.
- DeepSpeech: е изпълнение на TensorFLow на архитектурата DeepSpeech на Baidu.
- Саймън: доста гъвкав софтуер за разпознаване на реч.
- Калди: е инструментариум за проектиране на C ++ за изследване на разпознаване на реч.
- CMUSфинкс: в този случай това е двигател за разпознаване на глас за мобилни приложения и сървъри.
- deepspeech.python: е изпълнение на DeepSPeech с Python и използване на Baidu Warp-CTC.
Много добре и ще има ли някакъв добър TTS (текст в реч) за linux?
В Windows и Android има много качествени гласове като Loquendo, Ivona или NeoSpeech, но те не са за Linux. На Linux опитах гласовете mbrola и picoTTS, но те са много роботизирани.
Cepstral предлага безплатен глас Alejandra за linux, който е доста добър, но не знаех как да го инсталирам.
Влизам в същото, ако получите добър дял
Можете да използвате loquendo с вино на linux. Препоръчвам това видео ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Опитах се да инсталирам асистент, имам предвид Google Assistant и не можах, останах в частта от файла на системния регистър, мисля, че се нарича. Жалко, че Алекса е глупост ...
Програмата espeak работи на debian apt install espeak конзола. И се присъединете например към espeak -ves «Hello World»
-ves е v = гласовете е = испански
Имате много опции за четене на текстов файл, запис на резултата във wav файл.
поздрави
истината е много лоша, прозорци, това е друг свят ... ето те изостават с 10 години
И 3 години по-късно, да! това все още е просрочено.