A legjobb beszédfelismerő eszközök Linux számára

Hangfelismerés háttér

A hangot egyre inkább használják az eszközeinkkel való együttműködésre, ráadásul ez az egyetlen módszer azok számára, akiknek ilyen típusú akadálymentességi módszerekre van szükségük. Mindenesetre nagyon kényelmes beszélni, ha szöveget diktálunk, vagy egyszerűen beírjuk a hangparancsokat a rendszereinkbe, hogy valamilyen műveletet végezzenek anélkül, hogy kezüket használnák. Az a probléma beszédfelismerés olyan motorokon alapulnak, amelyek matematikai algoritmusokat használnak a beszéd felismerésére, és nem 100% -ban megbízhatóak.

A technológiai fejlődés egyre inkább a megbízhatóság tökéletesítésig, és a mesterséges intelligencia és a nagy adatrendszerek is sokat segítenek a beszédfelismerő programok hatalmas fejlesztésében. Az utóbbi időben sok erőfeszítést fektetnek e rendszerek maximális fejlesztésére, és sok tanulmány arra összpontosít, hogy javítsa az irányítást és a jövő interfészévé tegye őket. Ne feledje, hogy a jelenlegi interfészek kevésbé természetesek az emberek számára, és kevésbé gyorsak, mint a hang.

A hangfelismerő rendszerek értéke az elkövetkező években körülbelül 10 milliárd dollár lesz, ezért a nagyvállalatok olyan asszisztensek fejlesztésére összpontosítanak, mint az Apple Siri, a Microsoft Cortana vagy Mycroft Linuxhoz, amellett, hogy egyre népszerűbbé és gyakoribbá válnak olyan termékek, mint az Amazon Echo, a Google Home vagy az Apple HomePod for home, valamint a kifinomult hangfelismerő rendszerek integrálása a csatlakoztatott autókba.

Ez azt mondta, a beszédfelismerő eszközök listája a Linux számára hang:

  • Julius: egy erőteljes, folyamatos beszédfelismerő motor, sok szókinccsel.
  • DeepSpeech: a Baidu DeepSpeech architektúrájának TensorFLow megvalósítása.
  • Simon: meglehetősen rugalmas beszédfelismerő szoftver.
  • kaldi: egy C ++ tervezési eszközkészlet a beszédfelismerés kutatásához.
  • CMUSphinx: ebben az esetben a mobilalkalmazások és szerverek hangfelismerő motorja.
  • mélybeszéd.python: a DeepSPeech megvalósítása Python-nal és a Baidu Warp-CTC használatával.

Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: AB Internet Networks 2008 SL
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   Miguel Angel dijo

    Nagyon jó, és lesz-e valami jó TTS (szövegből beszédbe) a linuxhoz?

    A Windows-ban és az Android-ban nagyon jó minőségű hangok vannak, mint például a Loquendo, az Ivona vagy a NeoSpeech, de nem Linuxra szólnak. Linuxon kipróbáltam az mbrola és a picoTTS hangokat, de ezek nagyon robotikusak.

    A Cepstral egy ingyenes Alejandra hangot kínál a linuxhoz, ami nagyon jó, de nem tudtam, hogyan kell telepíteni.

    1.    RAUL dijo

      Ugyanebben járok, ha jó részesedést kap

      1.    Armando dijo

        Használhatja a loquendót borral a linuxon. Ajánlom ezt a videót ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Megpróbáltam telepíteni egy asszisztenst, mármint a Google Segédet, és nem tudtam. Maradtam a rendszerleíró fájlban, azt hiszem, hogy hívják. Kár, hogy Alexa szar ...

  3.   Gerardo dijo

    Az espeak program a debian apt install espeak konzolon működik. És csatlakozzon például a «Hello World» espeak -ves-hez

    a -ves v = hangok = spanyol

    Számos lehetősége van egy szöveges fájl elolvasására, az eredmény írása egy wav fájlba.

    Üdvözlet

  4.   folyó dijo

    az igazság nagyon rossz, a windows egy másik világ ... itt 10 évvel lemaradtak

    1.    Raul dijo

      És 3 év múlva igen! ez még esedékes.