קול היא יותר ויותר שיטה המשמשת לאינטראקציה עם המכשירים שלנו, בנוסף להיותה השיטה היחידה למי שזקוק לשיטות נגישות מסוג זה. בכל מקרה, די נוח לדבר כדי להכתיב טקסט או פשוט להזין פקודות קוליות למערכות שלנו כך שהם יבצעו פעולה כלשהי בלי להשתמש בידיים. הבעיה היא ש זיהוי דיבור הם מבוססים על מנועים המשתמשים באלגוריתמים מתמטיים כדי לזהות דיבור ואינם אמינים ב 100%.
ההתקדמות הטכנולוגית מביאה יותר ויותר את אמינות לשלמות, ובינה מלאכותית ומערכות ביג דאטה גם עוזרות רבות לשיפור תוכניות זיהוי הדיבור בצורה אדירה. לאחרונה נעשים מאמצים רבים לשיפור מערכות אלו באופן מקסימאלי, ומחקרים רבים מתמקדים בה כדי לשפר את השליטה ולהפוך אותן לממשק העתיד. זכור שממשקים עכשוויים פחות טבעיים לאנשים ופחות מהירים מקול.
ערך זיהוי קולי יעמוד על ערך של כ -10 מיליארד דולר בשנים הקרובות ולכן חברות גדולות מתמקדות בפיתוח עוזרים כמו סירי של אפל, קורטנה של מיקרוסופט או Mycroft ל- Linux, בנוסף להיות מוצרים פופולריים ותכופים יותר כמו אמזון אקו, גוגל הום או אפל הומפוד לבית, כמו גם שילוב מערכות זיהוי קולי מתוחכמות במכוניות מחוברות.
עם זאת, רשימת הכלים שלנו לזיהוי דיבור עבור לינוקס צליל:
- יוליוס: הוא מנוע חזק לזיהוי דיבור עם הרבה אוצר מילים.
- DeepSpeech: הוא יישום TensorFLow של אדריכלות ה- DeepSpeech של Baidu.
- סיימון: תוכנת זיהוי דיבור גמישה למדי.
- קלדי: הוא ערכת כלים לעיצוב C ++ למחקר זיהוי דיבור.
- CMUSphinx: במקרה זה זהו מנוע זיהוי קולי לאפליקציות ושרתים ניידים.
- deepspeech.python: הוא יישום של DeepSPeech עם Python ושימוש ב- Baidu Warp-CTC.
טוב מאוד, ויהיה TTS טוב (טקסט לדיבור) עבור לינוקס?
ב- Windows וב- Android יש קולות באיכות טובה מאוד כמו Loquendo, Ivona או NeoSpeech, אבל הם לא עבור לינוקס. בלינוקס ניסיתי את הקולות mbrola ו- picoTTS אבל הם מאוד רובוטיים.
Cepstral מציעה את הקול של אלחנדרה בחינם עבור לינוקס וזה די טוב, אבל לא ידעתי איך להתקין אותו.
אני הולך באותו דבר אם אתה מקבל נתח טוב
אתה יכול להשתמש בלוקנדו עם יין בלינוקס. אני ממליץ על הסרטון הזה ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
ניסיתי להתקין עוזר, זאת אומרת, עוזר גוגל ולא יכולתי, נשארתי בחלק של קובץ הרישום, אני חושב שזה נקרא. חבל שאלכסה היא שטויות ...
תוכנית ה- espeak עובדת על קונסולת ה- espeak של Debian apt. והצטרף לדוגמא לדברים - שלום העולם "
ה- -ves הוא v = הקולות הוא = ספרדית
יש לך אפשרויות רבות לקרוא קובץ טקסט, לכתוב את התוצאה לקובץ wav.
לגבי
האמת הכל רע מאוד, חלונות שזה עולם אחר ... הנה הם מאחוריהם 10 שנים
ו-3 שנים מאוחר יותר, כן! זה עדיין באיחור.