Mjetet më të mira për njohjen e të folurit për Linux

Sfondi i njohjes së zërit

Zëri është gjithnjë e më shumë një metodë e përdorur për të bashkëvepruar me pajisjet tona, përveç që është metoda e vetme për ata që kanë nevojë për këtë lloj të metodave të aksesit. Në çdo rast, është mjaft komode të flasësh për të diktuar tekst ose thjesht të futësh komanda zanore në sistemet tona në mënyrë që ata të bëjnë një lloj operacioni pa përdorur duart e tyre. Problemi është se njohja e zërit ato bazohen në motorë që përdorin algoritme matematikore për të njohur fjalimin dhe nuk janë 100% të besueshëm.

Përparimet teknologjike gjithnjë e më shumë po sjellin seriozitet në përsosmëri, dhe inteligjenca artificiale dhe sistemet e të dhënave të mëdha po ndihmojnë shumë për të përmirësuar jashtëzakonisht shumë programet e njohjes së fjalës. Kohët e fundit po bëhen shumë përpjekje për të përmirësuar këto sisteme në maksimum, dhe shumë studime janë përqendruar në të për të përmirësuar kontrollin dhe për t'i bërë ato ndërfaqen e së ardhmes. Mbani në mend se ndërfaqet aktuale janë më pak të natyrshme për njerëzit dhe më pak të shpejta se zëri.

Sistemet e njohjes së zërit do të kenë një vlerë prej rreth 10 miliardë dollarë në vitet e ardhshme dhe kjo është arsyeja pse kompanitë e mëdha po përqendrohen në zhvillimin e asistentëve të tillë si Apple Siri, Microsoft's Cortana ose Mycroft për Linux, përveç që bëhen gjithnjë e më të popullarizuara dhe produkte të shpeshta si Amazon Echo, Google Home ose Apple HomePod për shtëpinë, si dhe integrimin e sistemeve të sofistikuara të njohjes së zërit në makinat e lidhura.

Kjo tha, lista jonë e mjeteve të njohjes së fjalës për Linux shëndoshë:

  • Julius: është një motor i fuqishëm i njohjes së vazhdueshme të fjalës me shumë fjalor.
  • Fjalimi i thellë: është një zbatim i TensorFLow i arkitekturës DeepSpeech të Baidu.
  • Simon: një softuer mjaft fleksibël për njohjen e të folurit.
  • kaldi: është një vegël e dizajnit C ++ për kërkimin e njohjes së fjalës.
  • CMUSphinx: në këtë rast është një motor i njohjes së zërit për aplikacione dhe servera celularë.
  • fjalim i thellë.piton: është një implementim i DeepSPeech me Python dhe duke përdorur Baidu Warp-CTC.

Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: AB Internet Networks 2008 SL
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.

  1.   Miguel Angel dijo

    Shumë mirë, dhe a do të ketë ndonjë TTS të mirë (teksti në të folur) për linux?

    Në Windows dhe Android ka zëra me cilësi shumë të mirë si Loquendo, Ivona ose NeoSpeech, por nuk janë për Linux. Në Linux provova zërat mbrola dhe picoTTS por ata janë shumë robotikë.

    Cepstral ofron zërin e Alejandrës falas për linux i cili është mjaft i mirë, por nuk dija si ta instaloja.

    1.    RAUL dijo

      Unë eci në të njëjtën gjë nëse merr një pjesë të mirë

      1.    Armando dijo

        Ju mund të përdorni loquendo me verë në linux. Unë rekomandoj këtë video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dijo

    Unë u përpoqa të instaloj një asistent, dua të them, Google Assistant dhe nuk munda, qëndrova në pjesën e skedarit të regjistrit, mendoj se quhet. Sa keq që Alexa është kot ...

  3.   Gerardo dijo

    Programi espeak punon në konsolën e espeak debian apt install. Dhe bashkohuni për shembull espeak -ves «Përshëndetje Botërore»

    -ves është v = zërat është = spanjisht

    Ju keni shumë mundësi për të lexuar një skedar teksti, shkruani rezultatin në një skedar wav.

    të fala

  4.   raul dijo

    e vërteta është e gjitha shumë e keqe, dritaret që janë një botë tjetër ... këtu ata janë 10 vjet më vonë

    1.    Raul dijo

      Dhe 3 vjet më vonë, po! kjo është ende e vonuar.