أفضل أدوات التعرف على الكلام لنظام التشغيل Linux

أفضل أدوات التعرف على الكلام لنظام Linux

2 دقيقة

يتزايد استخدام الصوت للتفاعل مع أجهزتنا ، بالإضافة إلى كونه الطريقة الوحيدة لمن يحتاجون إلى هذا النوع من طرق الوصول. على أي حال ، من المريح التحدث لإملاء نص أو ببساطة إدخال الأوامر الصوتية في أنظمتنا حتى يقومون بنوع من العمليات دون استخدام أيديهم. المشكلة هي التعرف على الكلام إنها تستند إلى محركات تستخدم خوارزميات رياضية للتعرف على الكلام وليست موثوقة بنسبة 100٪.

التقدم التكنولوجي يجلب بشكل متزايد دقة إلى الكمال ، ويساعد الذكاء الاصطناعي وأنظمة البيانات الكبيرة أيضًا كثيرًا في تحسين برامج التعرف على الكلام بشكل كبير. في الآونة الأخيرة ، يتم بذل العديد من الجهود لتحسين هذه الأنظمة إلى أقصى حد ، وتركز العديد من الدراسات عليها لتحسين التحكم وجعلها واجهة المستقبل. ضع في اعتبارك أن الواجهات الحالية أقل طبيعية للأشخاص وأقل سرعة من الصوت.

ستبلغ قيمة أنظمة التعرف على الصوت حوالي 10 مليارات دولار في السنوات القادمة ولهذا السبب تركز الشركات الكبيرة على تطوير المساعدين مثل Apple's Siri أو Microsoft Cortana أو Mycroft لينكس، بالإضافة إلى زيادة شعبية المنتجات وتكرارها مثل Amazon Echo أو Google Home أو Apple HomePod للمنزل ، فضلاً عن دمج أنظمة التعرف على الصوت المتطورة في السيارات المتصلة.

ومع ذلك ، قائمة أدوات التعرف على الكلام لنظام التشغيل Linux هي:

جوليوس: هو محرك قوي للتعرف المستمر على الكلام مع الكثير من المفردات.
كلام عميق: هو تنفيذ TensorFLow لهندسة Baidu's DeepSpeech.
سيمون: برنامج التعرف على الكلام مرن إلى حد ما.
كالدي: عبارة عن مجموعة أدوات تصميم C ++ لأبحاث التعرف على الكلام.
سموسفينكس: في هذه الحالة هو محرك التعرف على الصوت لتطبيقات الهاتف المحمول والخوادم.
Deepspeech.python: هو تطبيق DeepSPeech مع Python واستخدام Baidu Warp-CTC.

اترك تعليقك الغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

تعليق *

اسم*

البريد الإلكتروني*

أقبل شروط الخصوصية*

المسؤول عن البيانات: AB Internet Networks 2008 SL
الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
الشرعية: موافقتك
توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.

أنا ترغب في الحصول على النشرة الإخبارية

ميغيل انخيل قال
منذ سنوات 6

جيد جدًا ، وهل سيكون هناك أي TTS (تحويل النص إلى كلام) جيد لنظام التشغيل Linux؟

في Windows و Android ، توجد أصوات جيدة جدًا مثل Loquendo أو Ivona أو NeoSpeech ، ولكنها ليست مخصصة لنظام التشغيل Linux. على Linux ، جربت أصوات mbrola و picoTTS لكنها آلية للغاية.

يقدم Cepstral صوت Alejandra مجانًا لنظام Linux وهو أمر جيد جدًا ، لكنني لم أكن أعرف كيفية تثبيته.

الرد على Miguel Angel
1. راؤول قال
  منذ سنوات 6
  
  أسير في نفس الشيء إذا حصلت على حصة جيدة
  
  الرد على rAUL
  1. أرماندو قال
    منذ سنوات 6
    
    يمكنك استخدام loquendo مع النبيذ على نظام Linux. أوصي بهذا الفيديو ...
    
    https://www.youtube.com/watch?v=OfGxR_O0Vjk
    
    الرد على Armando
Nasher_87 (ARG) قال
منذ سنوات 6

حاولت تثبيت مساعد ، أعني ، مساعد Google ولم أستطع ، بقيت في جزء من ملف التسجيل ، أعتقد أنه يسمى. اليكسا سيئة للغاية هو حماقة ...

الرد على Nasher_87 (ARG)
جيراردو قال
منذ سنوات 6

يعمل برنامج espeak على وحدة التحكم debian apt install espeak. وانضم على سبيل المثال espeak -ves «Hello World»

the -ves is v = voices = Spanish

لديك العديد من الخيارات لقراءة ملف نصي ، اكتب النتيجة في ملف wav.

تحياتي

الرد على Gerardo
راؤول قال
منذ سنوات 6

الحقيقة كلها سيئة للغاية ، النوافذ هي عالم آخر ... ها هم متأخرون بعشر سنوات

الرد على راؤول
1. راؤول قال
  منذ سنوات 2
  
  وبعد 3 سنوات ، نعم! هذا ما زال متأخرا.
  
  الرد على راؤول