De bedste talegenkendelsesværktøjer til Linux

Baggrund for stemmegenkendelse

Stemme er i stigende grad en metode, der bruges til at interagere med vores enheder, udover at være den eneste metode for dem, der har brug for denne type tilgængelighedsmetoder. Under alle omstændigheder er det ganske behageligt at tale for at diktere tekst eller blot indtaste stemmekommandoer i vores systemer, så de udfører en slags operation uden at bruge deres hænder. Problemet er, at stemmegenkendelse de er baseret på motorer, der bruger matematiske algoritmer til at genkende tale og ikke er 100% pålidelige.

Teknologiske fremskridt bringer i stigende grad pålidelighed til perfektion, og kunstig intelligens og big data-systemer hjælper også meget med at forbedre talegenkendelsesprogrammer enormt. På det seneste er der gjort en stor indsats for at forbedre disse systemer maksimalt, og mange undersøgelser fokuserer på det for at forbedre kontrollen og gøre dem til fremtidens grænseflade. Husk, at nuværende grænseflader er mindre naturlige for mennesker og mindre hurtige end stemme.

Stemmegenkendelsessystemer vil have en værdi på ca. 10 milliarder dollars i de kommende år, og det er grunden til, at store virksomheder fokuserer på udviklingen af ​​assistenter som Apples Siri, Microsofts Cortana eller Mycroft til Linuxud over at blive mere og mere populære og hyppige produkter som Amazon Echo, Google Home eller Apple HomePod til hjemmet samt at integrere sofistikerede stemmegenkendelsessystemer i tilsluttede biler.

Når det er sagt, vores liste over talegenkendelsesværktøjer til Linux lyd:

  • Julius: er en kraftfuld kontinuerlig talegenkendelsesmotor med masser af ordforråd.
  • DeepSpeech: er en TensorFLow-implementering af Baidus DeepSpeech-arkitektur.
  • Simon: en ret fleksibel software til talegenkendelse.
  • kaldi: er et C ++ designværktøjssæt til forskning i talegenkendelse.
  • CMUSphinx: i dette tilfælde er det en stemmegenkendelsesmotor til mobilapps og servere.
  • deepspeech.python: er en implementering af DeepSPeech med Python og bruger Baidu Warp-CTC.

7 kommentarer, lad dine

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for data: AB Internet Networks 2008 SL
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.

  1.   Miguel Angel sagde han

    Meget god, og vil der være nogen god TTS (tekst til tale) til Linux?

    I Windows og Android er der stemmer af meget god kvalitet som Loquendo, Ivona eller NeoSpeech, men de er ikke til Linux. På Linux prøvede jeg mbrola- og picoTTS-stemmerne, men de er meget robotiske.

    Cepstral tilbyder gratis Alejandras stemme til linux, hvilket er ret godt, men jeg vidste ikke, hvordan jeg skulle installere det.

    1.    RAUL sagde han

      Jeg går i det samme, hvis du får en god andel

      1.    Armando sagde han

        Du kan bruge loquendo med vin på linux. Jeg anbefaler denne video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) sagde han

    Jeg forsøgte at installere en assistent, jeg mener, Google Assistent, og jeg kunne ikke, jeg blev i den del af registreringsdatabasen, jeg tror, ​​den hedder. Alt for dårlig Alexa er lort ...

  3.   Gerardo sagde han

    Espeak-programmet fungerer på debian apt installer espeak-konsollen. Og tilmeld dig f.eks. Espeak -ves «Hello World»

    -ves er v = stemmer er = spansk

    Du har mange muligheder for at læse en tekstfil, skrive resultatet til en wav-fil.

    hilsen

  4.   raul sagde han

    sandheden er alt sammen meget dårlig, vinduer der er en anden verden ... her er de 10 år bagud

    1.    Raul sagde han

      Og 3 år senere, ja! dette er stadig forsinket.