הכלים הטובים ביותר לזיהוי דיבור עבור לינוקס

רקע לזיהוי קולי

קול היא יותר ויותר שיטה המשמשת לאינטראקציה עם המכשירים שלנו, בנוסף להיותה השיטה היחידה למי שזקוק לשיטות נגישות מסוג זה. בכל מקרה, די נוח לדבר כדי להכתיב טקסט או פשוט להזין פקודות קוליות למערכות שלנו כך שהם יבצעו פעולה כלשהי בלי להשתמש בידיים. הבעיה היא ש זיהוי דיבור הם מבוססים על מנועים המשתמשים באלגוריתמים מתמטיים כדי לזהות דיבור ואינם אמינים ב 100%.

ההתקדמות הטכנולוגית מביאה יותר ויותר את אמינות לשלמות, ובינה מלאכותית ומערכות ביג דאטה גם עוזרות רבות לשיפור תוכניות זיהוי הדיבור בצורה אדירה. לאחרונה נעשים מאמצים רבים לשיפור מערכות אלו באופן מקסימאלי, ומחקרים רבים מתמקדים בה כדי לשפר את השליטה ולהפוך אותן לממשק העתיד. זכור שממשקים עכשוויים פחות טבעיים לאנשים ופחות מהירים מקול.

ערך זיהוי קולי יעמוד על ערך של כ -10 מיליארד דולר בשנים הקרובות ולכן חברות גדולות מתמקדות בפיתוח עוזרים כמו סירי של אפל, קורטנה של מיקרוסופט או Mycroft ל- Linux, בנוסף להיות מוצרים פופולריים ותכופים יותר כמו אמזון אקו, גוגל הום או אפל הומפוד לבית, כמו גם שילוב מערכות זיהוי קולי מתוחכמות במכוניות מחוברות.

עם זאת, רשימת הכלים שלנו לזיהוי דיבור עבור לינוקס צליל:

  • יוליוס: הוא מנוע חזק לזיהוי דיבור עם הרבה אוצר מילים.
  • DeepSpeech: הוא יישום TensorFLow של אדריכלות ה- DeepSpeech של Baidu.
  • סיימון: תוכנת זיהוי דיבור גמישה למדי.
  • קלדי: הוא ערכת כלים לעיצוב C ++ למחקר זיהוי דיבור.
  • CMUSphinx: במקרה זה זהו מנוע זיהוי קולי לאפליקציות ושרתים ניידים.
  • deepspeech.python: הוא יישום של DeepSPeech עם Python ושימוש ב- Baidu Warp-CTC.

7 תגובות, השאר את שלך

השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי על הנתונים: AB Internet Networks 2008 SL
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   מיגל אנחל דיג'ו

    טוב מאוד, ויהיה TTS טוב (טקסט לדיבור) עבור לינוקס?

    ב- Windows וב- Android יש קולות באיכות טובה מאוד כמו Loquendo, Ivona או NeoSpeech, אבל הם לא עבור לינוקס. בלינוקס ניסיתי את הקולות mbrola ו- picoTTS אבל הם מאוד רובוטיים.

    Cepstral מציעה את הקול של אלחנדרה בחינם עבור לינוקס וזה די טוב, אבל לא ידעתי איך להתקין אותו.

    1.    ראול דיג'ו

      אני הולך באותו דבר אם אתה מקבל נתח טוב

      1.    ארמנדו דיג'ו

        אתה יכול להשתמש בלוקנדו עם יין בלינוקס. אני ממליץ על הסרטון הזה ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) דיג'ו

    ניסיתי להתקין עוזר, זאת אומרת, עוזר גוגל ולא יכולתי, נשארתי בחלק של קובץ הרישום, אני חושב שזה נקרא. חבל שאלכסה היא שטויות ...

  3.   חררדו דיג'ו

    תוכנית ה- espeak עובדת על קונסולת ה- espeak של Debian apt. והצטרף לדוגמא לדברים - שלום העולם "

    ה- -ves הוא v = הקולות הוא = ספרדית

    יש לך אפשרויות רבות לקרוא קובץ טקסט, לכתוב את התוצאה לקובץ wav.

    לגבי

  4.   ראול דיג'ו

    האמת הכל רע מאוד, חלונות שזה עולם אחר ... הנה הם מאחוריהם 10 שנים

    1.    ראול דיג'ו

      ו-3 שנים מאוחר יותר, כן! זה עדיין באיחור.