A hangot egyre inkább használják az eszközeinkkel való együttműködésre, ráadásul ez az egyetlen módszer azok számára, akiknek ilyen típusú akadálymentességi módszerekre van szükségük. Mindenesetre nagyon kényelmes beszélni, ha szöveget diktálunk, vagy egyszerűen beírjuk a hangparancsokat a rendszereinkbe, hogy valamilyen műveletet végezzenek anélkül, hogy kezüket használnák. Az a probléma beszédfelismerés olyan motorokon alapulnak, amelyek matematikai algoritmusokat használnak a beszéd felismerésére, és nem 100% -ban megbízhatóak.
A technológiai fejlődés egyre inkább a megbízhatóság tökéletesítésig, és a mesterséges intelligencia és a nagy adatrendszerek is sokat segítenek a beszédfelismerő programok hatalmas fejlesztésében. Az utóbbi időben sok erőfeszítést fektetnek e rendszerek maximális fejlesztésére, és sok tanulmány arra összpontosít, hogy javítsa az irányítást és a jövő interfészévé tegye őket. Ne feledje, hogy a jelenlegi interfészek kevésbé természetesek az emberek számára, és kevésbé gyorsak, mint a hang.
A hangfelismerő rendszerek értéke az elkövetkező években körülbelül 10 milliárd dollár lesz, ezért a nagyvállalatok olyan asszisztensek fejlesztésére összpontosítanak, mint az Apple Siri, a Microsoft Cortana vagy Mycroft Linuxhoz, amellett, hogy egyre népszerűbbé és gyakoribbá válnak olyan termékek, mint az Amazon Echo, a Google Home vagy az Apple HomePod for home, valamint a kifinomult hangfelismerő rendszerek integrálása a csatlakoztatott autókba.
Ez azt mondta, a beszédfelismerő eszközök listája a Linux számára hang:
- Julius: egy erőteljes, folyamatos beszédfelismerő motor, sok szókinccsel.
- DeepSpeech: a Baidu DeepSpeech architektúrájának TensorFLow megvalósítása.
- Simon: meglehetősen rugalmas beszédfelismerő szoftver.
- kaldi: egy C ++ tervezési eszközkészlet a beszédfelismerés kutatásához.
- CMUSphinx: ebben az esetben a mobilalkalmazások és szerverek hangfelismerő motorja.
- mélybeszéd.python: a DeepSPeech megvalósítása Python-nal és a Baidu Warp-CTC használatával.
Nagyon jó, és lesz-e valami jó TTS (szövegből beszédbe) a linuxhoz?
A Windows-ban és az Android-ban nagyon jó minőségű hangok vannak, mint például a Loquendo, az Ivona vagy a NeoSpeech, de nem Linuxra szólnak. Linuxon kipróbáltam az mbrola és a picoTTS hangokat, de ezek nagyon robotikusak.
A Cepstral egy ingyenes Alejandra hangot kínál a linuxhoz, ami nagyon jó, de nem tudtam, hogyan kell telepíteni.
Ugyanebben járok, ha jó részesedést kap
Használhatja a loquendót borral a linuxon. Ajánlom ezt a videót ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Megpróbáltam telepíteni egy asszisztenst, mármint a Google Segédet, és nem tudtam. Maradtam a rendszerleíró fájlban, azt hiszem, hogy hívják. Kár, hogy Alexa szar ...
Az espeak program a debian apt install espeak konzolon működik. És csatlakozzon például a «Hello World» espeak -ves-hez
a -ves v = hangok = spanyol
Számos lehetősége van egy szöveges fájl elolvasására, az eredmény írása egy wav fájlba.
Üdvözlet
az igazság nagyon rossz, a windows egy másik világ ... itt 10 évvel lemaradtak
És 3 év múlva igen! ez még esedékes.