Voice ass ëmmer méi eng Method déi benotzt gëtt fir mat eise Geräter ze interagéieren, zousätzlech ass déi eenzeg Method fir déi déi dës Aart vu Accessibilitéitsmethoden brauchen. Op jiddfer Fall ass et ganz bequem ze schwätzen fir Text ze diktéieren oder einfach Stëmmbefeeler an eis Systemer anzeginn, sou datt se eng Aart Operatioun maachen ouni hir Hänn ze benotzen. De Problem ass Erkenntnis si baséieren op Motoren déi mathematesch Algorithmen benotze fir Ried ze erkennen a sinn net 100% zouverléisseg.
Technologesch Fortschrëtter bréngen ëmmer méi d ' Zouverlässegkeet zur Perfektioun, a kënschtlech Intelligenz a Big Data Systemer hëllefen och vill fir d'Riederkennungsprogrammer enorm ze verbesseren. A leschter Zäit gi vill Efforte gemaach fir dës Systemer maximal ze verbesseren, a vill Studie fokusséieren drop d'Kontroll ze verbesseren an hinnen d'Interface vun der Zukunft ze maachen. Denkt drun datt aktuell Interfaces manner natierlech fir d'Leit sinn a manner séier wéi d'Stëmm.
Stëmmerkennungssystemer wäerten an de kommende Joeren e Wäert vun ongeféier 10 Milliarden Dollar hunn an dofir fokusséiere grouss Firmen op d'Entwécklung vun Assistenten wéi Apple Siri, Microsoft Cortana Mycroft fir Linux, zousätzlech zu ëmmer méi populär an heefeg Produkter wéi Amazon Echo, Google Home oder Apple HomePod fir d'Haus, souwéi sophistikéiert Stëmmerkennungssystemer a verbonne Autoen z'integréieren.
Dat gesot, eis Lëscht vu Sproocherkennungsinstrumenter fir Linux sinn:
- Julius: ass e mächtege kontinuéierleche Spracherkennungsmotor mat vill Vokabular.
- DeepSpeech: ass eng TensorFLow Ëmsetzung vun Baidu's DeepSpeech Architektur.
- Simon: eng zimlech flexibel Spracherkennungssoftware.
- kaldi: ass en C ++ Design Toolkit fir Riederkennungsfuerschung.
- CMUSphinx: an dësem Fall ass et eng Stëmmerkennungsmotor fir mobil Apps an Serveren.
- deepspeech.python: ass eng Implementéierung vun DeepSPeech mam Python a mat Baidu Warp-CTC.
Ganz gutt, a gëtt et gutt TTS (Text zu Ried) fir Linux?
A Windows an Android ginn et ganz gutt Qualitéit Stëmmen wéi Loquendo, Ivona oder NeoSpeech, awer si sinn net fir Linux. Op Linux hunn ech d'Mbrola a PicoTTS Stëmme probéiert awer si si ganz robotesch.
Cepstral bitt gratis dem Alejandra seng Stëmm fir Linux dat ass relativ gutt, awer ech wousst net wéi ech et installéieren.
Ech ginn an d'selwecht wann Dir e gudden Undeel kritt
Dir kënnt loquendo mat Wäin op Linux benotzen. Ech empfeelen dëse Video ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Ech hu probéiert en Assistent z'installéieren, ech mengen, Google Assistant an ech konnt net, ech sinn am Deel vun der Registry-Datei bliwwen, ech mengen et heescht. Schued datt Alexa Schäiss ass ...
Den espeak Programm funktionnéiert op der Debian apt installéiere espeak Konsole. A maacht mat zum Beispill espeak -ves «Hello World»
déi -ves ass v = Stëmmen ass = Spuenesch
Dir hutt vill Méiglechkeeten eng Textdatei ze liesen, schreift d'Resultat an eng Wav Datei.
Wat
d'Wourecht ass alles ganz schlecht, Fënsteren déi eng aner Welt ass ... hei sinn se 10 Joer hannendrun
An 3 Joer méi spéit, jo! dat ass nach ze laang.