Үн, биздин түзмөктөр менен өз ара аракеттенүү үчүн барган сайын көбүрөөк колдонулуп жатат, бул мүмкүнчүлүктүн ушул түрүнө муктаж болгондор үчүн жалгыз ыкма. Кандай болгон күндө дагы, текстти диктанттап сүйлөө же жөн гана үн буйруктарын биздин тутумдарга киргизүү, алар өз колдорун колдонбостон кандайдыр бир иш-аракеттерди жасашат. Маселе мынада Кеп таануу алар сүйлөөнү таануу үчүн математикалык алгоритмдерди колдонгон кыймылдаткычтарга негизделген жана 100% ишенимдүү эмес.
Техникалык жетишкендиктер улам барган сайын көбөйүп жатат ишенимдүүлүк кемчиликсиздикке чейин, ошондой эле жасалма интеллект жана чоң маалымат тутумдары сүйлөөнү таануу программаларын жакшыртууга көп жардам берет. Акыркы учурларда бул тутумдарды максималдуу өркүндөтүү үчүн көптөгөн аракеттер көрүлүп жатат жана көзөмөлдү өркүндөтүү жана келечектин интерфейси кылуу үчүн көптөгөн изилдөөлөр буга багытталды. Учурдагы интерфейстер адамдар үчүн табигый мүнөздө эмес жана үнгө караганда ылдамыраак экендигин унутпаңыз.
Жакынкы жылдары үн таануу тутумдары болжол менен 10 миллиард долларга бааланат жана ошондуктан ири компаниялар Apple компаниясынын Siri, Microsoft корпорациясынын Cortana же Linux үчүн MycroftҮйгө Amazon Echo, Google Home, же Apple HomePod сыяктуу популярдуу жана тез-тез өнүмдөрдөн болуп, ошондой эле туташкан унааларга үнүн таануу системаларын интеграциялоо.
Башкача айтканда, мындай деди: биздин Linux үчүн сүйлөөнү таануу куралдарынын тизмеси Алар төмөнкүлөр:
- Julius: сөз байлыгы күчтүү, тынымсыз сүйлөөнү таануу тутуму.
- DeepSpeech: бул Baidu's DeepSpeech архитектурасынын TensorFLow жүзөгө ашырылышы.
- Симон: жетишерлик ийкемдүү сүйлөө таануу программасы.
- калди: сүйлөөнү таанууну изилдөө үчүн C ++ долбоорлоо куралы.
- CMUSphinx: бул учурда бул мобилдик колдонмолор жана серверлер үчүн үн таануучу кыймылдаткыч.
- терең сүйлөө.python: бул DeepSPeech программасын Python менен жана Baidu Warp-CTC колдонуп ишке ашыруу.
7 комментарий, өзүңүздүкүн калтырыңыз
Абдан жакшы, жана Linux үчүн жакшы ТТС (тексттен сүйлөөгө) болобу?
Windows жана Androidде Loquendo, Ivona же NeoSpeech сыяктуу мыкты сапаттуу үндөр бар, бирок алар Linux үчүн эмес. Linuxто мен mbrola жана picoTTS үндөрүн сынап көрдүм, бирок алар абдан роботтоштурулган.
Cepstral Linux үчүн акысыз Алехандранын үнүн сунуштайт, бул абдан жакшы, бирок мен аны кантип орнотууну билген эмесмин.
Жакшы үлүшкө ээ болсоңуз, мен дагы ошол жолдо жүрөм
Луендену шарап менен кошо Linux колдонсоңуз болот. Бул видеону сунуштайм ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Мен жардамчыны орнотууга аракет кылдым, демек, Google жардамчысы, мен жасай алган жокмун, реестр файлынын бөлүгүндө калдым, менимче, ал аталган. Өтө жаман Алекса - бул ...
Espeak программасы debian apt install espeak консолунда иштейт. Мисалы, "Hello World" espeak -ves каналына кошулуңуз.
-ves - v = үндөр = испанча
Сизде тексттик файлды окуунун, натыйжаны wav файлга жазуунун көптөгөн жолдору бар.
Урматтоо менен
Чындыгынын баары өтө жаман, башка дүйнө болгон терезелер ... бул жерде алар 10 жылдан артта калышты
Жана 3 жылдан кийин, ооба! бул дагы эле кечикти.