أفضل أدوات التعرف على الكلام لنظام Linux

خلفية التعرف على الصوت

يتزايد استخدام الصوت للتفاعل مع أجهزتنا ، بالإضافة إلى كونه الطريقة الوحيدة لمن يحتاجون إلى هذا النوع من طرق الوصول. على أي حال ، من المريح التحدث لإملاء نص أو ببساطة إدخال الأوامر الصوتية في أنظمتنا حتى يقومون بنوع من العمليات دون استخدام أيديهم. المشكلة هي التعرف على الكلام إنها تستند إلى محركات تستخدم خوارزميات رياضية للتعرف على الكلام وليست موثوقة بنسبة 100٪.

التقدم التكنولوجي يجلب بشكل متزايد دقة إلى الكمال ، ويساعد الذكاء الاصطناعي وأنظمة البيانات الكبيرة أيضًا كثيرًا في تحسين برامج التعرف على الكلام بشكل كبير. في الآونة الأخيرة ، يتم بذل العديد من الجهود لتحسين هذه الأنظمة إلى أقصى حد ، وتركز العديد من الدراسات عليها لتحسين التحكم وجعلها واجهة المستقبل. ضع في اعتبارك أن الواجهات الحالية أقل طبيعية للأشخاص وأقل سرعة من الصوت.

ستبلغ قيمة أنظمة التعرف على الصوت حوالي 10 مليارات دولار في السنوات القادمة ولهذا السبب تركز الشركات الكبيرة على تطوير المساعدين مثل Apple's Siri أو Microsoft Cortana أو Mycroft لينكس، بالإضافة إلى زيادة شعبية المنتجات وتكرارها مثل Amazon Echo أو Google Home أو Apple HomePod للمنزل ، فضلاً عن دمج أنظمة التعرف على الصوت المتطورة في السيارات المتصلة.

ومع ذلك ، قائمة أدوات التعرف على الكلام لنظام التشغيل Linux هي:

  • جوليوس: هو محرك قوي للتعرف المستمر على الكلام مع الكثير من المفردات.
  • كلام عميق: هو تنفيذ TensorFLow لهندسة Baidu's DeepSpeech.
  • سيمون: برنامج التعرف على الكلام مرن إلى حد ما.
  • كالدي: عبارة عن مجموعة أدوات تصميم C ++ لأبحاث التعرف على الكلام.
  • سموسفينكس: في هذه الحالة هو محرك التعرف على الصوت لتطبيقات الهاتف المحمول والخوادم.
  • Deepspeech.python: هو تطبيق DeepSPeech مع Python واستخدام Baidu Warp-CTC.

اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: AB Internet Networks 2008 SL
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.

  1.   ميغيل انخيل قال

    جيد جدًا ، وهل سيكون هناك أي TTS (تحويل النص إلى كلام) جيد لنظام التشغيل Linux؟

    في Windows و Android ، توجد أصوات جيدة جدًا مثل Loquendo أو Ivona أو NeoSpeech ، ولكنها ليست مخصصة لنظام التشغيل Linux. على Linux ، جربت أصوات mbrola و picoTTS لكنها آلية للغاية.

    يقدم Cepstral صوت Alejandra مجانًا لنظام Linux وهو أمر جيد جدًا ، لكنني لم أكن أعرف كيفية تثبيته.

    1.    راؤول قال

      أسير في نفس الشيء إذا حصلت على حصة جيدة

      1.    أرماندو قال

        يمكنك استخدام loquendo مع النبيذ على نظام Linux. أوصي بهذا الفيديو ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) قال

    حاولت تثبيت مساعد ، أعني ، مساعد Google ولم أستطع ، بقيت في جزء من ملف التسجيل ، أعتقد أنه يسمى. اليكسا سيئة للغاية هو حماقة ...

  3.   جيراردو قال

    يعمل برنامج espeak على وحدة التحكم debian apt install espeak. وانضم على سبيل المثال espeak -ves «Hello World»

    the -ves is v = voices = Spanish

    لديك العديد من الخيارات لقراءة ملف نصي ، اكتب النتيجة في ملف wav.

    تحياتي

  4.   راؤول قال

    الحقيقة كلها سيئة للغاية ، النوافذ هي عالم آخر ... ها هم متأخرون بعشر سنوات

    1.    راؤول قال

      وبعد 3 سنوات ، نعم! هذا ما زال متأخرا.