लिनक्स के लिए सबसे अच्छा भाषण मान्यता उपकरण

आवाज पहचान पृष्ठभूमि

आवाज का उपयोग हमारे उपकरणों के साथ बातचीत करने के लिए किया जाता है, इसके अलावा उन लोगों के लिए एकमात्र तरीका है जिन्हें इस प्रकार की पहुंच विधियों की आवश्यकता है। किसी भी मामले में, पाठ को बोलने के लिए बोलना काफी आसान है या बस हमारे सिस्टम में वॉयस कमांड दर्ज करें ताकि वे अपने हाथों का उपयोग किए बिना किसी तरह का ऑपरेशन कर सकें। समस्या यह है कि भाषण मान्यता वे इंजन पर आधारित होते हैं जो भाषण को पहचानने के लिए गणितीय एल्गोरिदम का उपयोग करते हैं और 100% विश्वसनीय नहीं होते हैं।

तकनीकी विकास तेजी से ला रहे हैं विश्वसनीयता पूर्णता के लिए, और कृत्रिम बुद्धिमत्ता और बड़े डेटा सिस्टम भी भाषण मान्यता कार्यक्रमों को बेहतर बनाने में बहुत मदद कर रहे हैं। इन प्रणालियों को अधिकतम करने के लिए हाल ही में कई प्रयास किए जा रहे हैं, और कई अध्ययन इस पर ध्यान केंद्रित कर रहे हैं ताकि नियंत्रण में सुधार हो और उन्हें भविष्य का इंटरफ़ेस बनाया जा सके। ध्यान रखें कि वर्तमान इंटरफेस लोगों के लिए कम और आवाज की तुलना में कम तेज है।

वॉयस रिकग्निशन सिस्टम का आने वाले वर्षों में लगभग 10 बिलियन डॉलर का मूल्य होगा और इसीलिए बड़ी कंपनियां एप्पल के सिरी, माइक्रोसॉफ्ट के कोरटाना या जैसे सहायकों के विकास पर ध्यान केंद्रित कर रही हैं। लिनक्स के लिए Mycroft, बढ़ती लोकप्रिय और लगातार उत्पादों जैसे कि अमेज़ॅन इको, Google होम या घर के लिए ऐप्पल होमपॉड बनने के साथ-साथ कनेक्टेड कारों में परिष्कृत आवाज मान्यता प्रणालियों को एकीकृत करना।

उसने कहा, लिनक्स के लिए भाषण पहचान उपकरणों की हमारी सूची ध्वनि:

  • जूलियस: बहुत सारी शब्दावली के साथ एक शक्तिशाली निरंतर भाषण मान्यता इंजन है।
  • गहरी बोली: Baidu के डीपस्पीच आर्किटेक्चर का एक टेंसरफ्लो कार्यान्वयन है।
  • साइमन: एक काफी लचीला भाषण मान्यता सॉफ्टवेयर।
  • कालड़ी: स्पीच रिकग्निशन रिसर्च के लिए C ++ डिज़ाइन टूलकिट है।
  • CMUSphinx: इस मामले में यह मोबाइल ऐप्स और सर्वर के लिए एक आवाज पहचान इंजन है।
  • डीपस्पीच.पायथन: अजगर के साथ डीपस्पाच का कार्यान्वयन है और Baidu ताना-सीटीसी का उपयोग कर रहा है।

अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एबी इंटरनेट नेटवर्क 2008 SL
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।

  1.   मिगुएल एंजेल कहा

    बहुत अच्छा है, और क्या लिनक्स के लिए कोई अच्छा टीटीएस (भाषण से पाठ) होगा?

    विंडोज और एंड्रॉइड में बहुत अच्छी गुणवत्ता वाली आवाजें हैं जैसे कि Loquendo, Ivona या NeoSpeech, लेकिन वे लिनक्स के लिए नहीं हैं। लिनक्स पर मैंने mbrola और picoTTS आवाज़ों की कोशिश की, लेकिन वे बहुत रोबोट हैं।

    सेफस्ट्राल लाइनक्स के लिए एक मुफ्त एलेजेंड्रा आवाज़ देता है जो बहुत अच्छा है, लेकिन मुझे नहीं पता था कि इसे कैसे स्थापित किया जाए।

    1.    राउल कहा

      अगर आपको अच्छा हिस्सा मिलता है तो मैं उसी में चलता हूं

      1.    आर्मंडो कहा

        आप linux पर वाइन के साथ loquendo का उपयोग कर सकते हैं। मैं इस वीडियो की सिफारिश करता हूं ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   नाशर_87 (एआरजी) कहा

    मैंने एक सहायक स्थापित करने की कोशिश की, मेरा मतलब है, Google सहायक और मैं नहीं कर सका, मैं रजिस्ट्री फ़ाइल के हिस्से में रहा, मुझे लगता है कि इसे कहा जाता है। बहुत बुरा एलेक्सा बकवास है ...

  3.   Gerardo कहा

    एस्पेक प्रोग्राम डेबियन एप इंस्टाल कंसोल पर काम करता है। और उदाहरण के लिए जुड़ें

    .ves को v = आवाज है = स्पेनिश

    आपके पास एक टेक्स्ट फ़ाइल पढ़ने के लिए कई विकल्प हैं, परिणाम को wav फ़ाइल में लिखें।

    सादर

  4.   नदी कहा

    सच्चाई बहुत खराब है, खिड़कियां जो एक और दुनिया है ... यहां वे 10 साल पीछे हैं

    1.    राउल कहा

      और 3 साल बाद, हाँ! यह अभी भी अतिदेय है।