मैकिन्से ने केदारो, इसका पहला ओपन सोर्स टूल पेश किया

कंसल्टिंग फर्म मैकिन्से से केदारो पहला खुला स्रोत उपकरण है

केदारो परियोजना GitHub पृष्ठ

केड्रो कंसल्टिंग फर्म मैकिन्से के एक डिवीजन द्वारा विकसित पहला ओपन सोर्स टूल है। यह डेटा वैज्ञानिकों और इंजीनियरों द्वारा उपयोग किए जाने के लिए बनाया गया था। एक है कोड लाइब्रेरी जिसका उपयोग डेटा और पाइप बनाने के लिए किया जा सकता हैएक मशीन सीखने की परियोजना के निर्माण ब्लॉकों।

मैकिन्से एंड कंपनी एक अमेरिकी वैश्विक प्रबंधन परामर्श कंपनी है। सार्वजनिक और निजी क्षेत्रों में प्रबंधन के निर्णयों का मूल्यांकन करने के लिए गुणात्मक और मात्रात्मक विश्लेषण करता है। उनके ग्राहकों में दुनिया के 80% सबसे बड़े निगम शामिल हैं।

पहला ओपन सोर्स टूल

कंपनी ने ओपन सोर्स लाइसेंस के तहत इन-हाउस विकसित उपकरणों में से एक को पहले जारी नहीं किया है। वास्तव में, केदारो का जन्म स्वामित्व सॉफ्टवेयर के रूप में हुआ था। हालांकि, जब कंपनी के साथ संबंध समाप्त हो गए, तो ग्राहकों के पास कार्यक्रम तक पहुंच नहीं थी।

केदारो नाम से निकला है केंद्र या कोर के लिए ग्रीक शब्द। इसे इसलिए चुना गया क्योंकि यह ओपन सोर्स टूल उन्नत विश्लेषण परियोजनाओं के निर्माण के लिए महत्वपूर्ण कोड प्रदान करता है।

केदारो के दो मुख्य फायदे हैं:

  • यह एक समान तरीके से विश्लेषणात्मक कोड को संरचित करके अधिक आसानी से सहयोग करने के लिए टीमों को सक्षम बनाता है।
  • यह किसी परियोजना के सभी चरणों के माध्यम से सभी घटकों को मूल रूप से प्रवाह करने की अनुमति देता है।

इसमें शामिल हैं

  • डेटा स्रोतों का समेकन,
  • डेटा सफाई
  • फ़ीचर क्रिएशन
  • व्याख्यात्मक या भविष्य कहनेवाला विश्लेषण के लिए मशीन लर्निंग मॉडल में डेटा फ़ीड।

केदारो को भी रेडी-टू-यूज़ कोड देने में मदद करता है। यह उन डेटा वैज्ञानिकों के लिए वास्तव में उपयोगी है जो आमतौर पर सॉफ्टवेयर निर्माण के विशेषज्ञ नहीं हैं।

केदार उपयोगी क्यों है?

ओपन सोर्स टूल जैसे केदारो अनुमति देते हैं हफ्तों तक एक प्रोटोटाइप को उत्पादन कोड में बदलने में समय लगता है। विश्लेषक कम समय कोडिंग और अधिक समय अपने ग्राहकों की समस्या निवारण में बिता सकते हैं।

केडरो किसी भी वातावरण में मॉड्यूलर डेटा चैनल, परीक्षण, प्रतिलिपि प्रस्तुत करने योग्य बनाने में मदद करता है और उपयोगकर्ताओं को पिछले डेटा राज्यों तक पहुंचने की अनुमति देता है। क्लाउड कंप्यूटिंग का उपयोग करके एक ही कोड को एक डेवलपर के लैपटॉप से ​​एंटरप्राइज़-ग्रेड प्रोजेक्ट में पास किया जा सकता है। इसका उपयोग सभी उद्योगों, मॉडल और डेटा स्रोतों के साथ भी किया जा सकता है।

मैकिन्से पहले ही 50 से अधिक परियोजनाओं पर केदारो का उपयोग कर चुके हैं। एक कार्यकारी के अनुसार, ग्राहक विशेष रूप से पाइप के दृश्य को पसंद करते हैं। वे तुरंत परिवर्तन के विभिन्न चरणों को देखते हैं, शामिल मॉडल के प्रकार, और कच्चे डेटा स्रोत पर वापस परिणाम का पता लगा सकते हैं।

मैकिन्से यह पहली कंपनी नहीं है जो सीधे प्रौद्योगिकी से संबंधित नहीं है जो ओपन सोर्स टूल प्रकाशित करता है। उबेर और एयरबीएनबी ने पहले ही कर दिया था।

केंड्रो सुविधाएँ और स्थापना

केदारो के लिए एक वर्कफ़्लो विकास उपकरण है मजबूत, स्केलेबल, तैनाती योग्य, प्रतिलिपि प्रस्तुत करने योग्य और संस्करणित डेटा चैनलों का निर्माण।

केदारो की मुख्य विशेषताएं क्या हैं?

1. प्रोजेक्ट टेम्प्लेट और कोडिंग मानक

  • एक आसान उपयोग, मानक परियोजना टेम्पलेट
  • क्रेडेंशियल, पंजीकरण, डेटा अपलोड और जुपिटर नोटबुक / लैब की सेटिंग्स।
  • पाइस्टेस्ट का उपयोग करके परीक्षण-संचालित विकास
  • स्फिंक्स एकीकरण अच्छी तरह से प्रलेखित कोड का उत्पादन करने के लिए

2. डेटा निष्कर्षण और संस्करण

  • डेटा प्रबंधन परत से कंप्यूटिंग परत को अलग करना, जिसमें विभिन्न डेटा स्वरूपों और भंडारण विकल्पों के लिए समर्थन शामिल है।
  • आपके डेटा सेट और मशीन लर्निंग मॉडल के लिए संस्करण

3. पाइप की मोड्यूलरिटी और एब्स्ट्रैक्शन

  • शुद्ध पायथन कार्यों के लिए समर्थन, नोड्स को कोड के बड़े हिस्से को छोटे स्वतंत्र वर्गों में विभाजित करने के लिए।
  • नोड्स के बीच निर्भरता का स्वचालित संकल्प

4. सुविधाओं की व्यापकता

  • एक प्लगइन प्रणाली जो केदारो की कमांड लाइन इंटरफेस (सीएलआई) में कमांड को इंजेक्ट करती है: केडरो-एयरफ्लो, जो एयरफ़्लो, एक वर्कफ़्लो शेड्यूलर को तैनात करने से पहले केडरो में अपने डेटा पाइपलाइन को प्रोटोटाइप करना आसान बनाता है। Kedro-Docker, कंटेनरों में Kedro परियोजनाओं की पैकिंग और शिपिंग के लिए एक उपकरण
  • केदारो को स्थानीय रूप से, परिसर में और क्लाउड (AWS, Azure, और GCP) या क्लस्टर (EMR, Azure HDinsight, GCP और Databricks) में तैनात किया जा सकता है।

हम केदारो को हमारे पूर्व संदर्भित लिनक्स वितरण पर स्थापित कर सकते हैं:

sudo apt install python3-pip
pip install kedro

वास्तविक करने के लिए:
pip3 install kedro -U

हम इसके साथ प्रलेखन देख सकते हैं:
kedro docs
अधिक जानकारी पर पाया जा सकता है परियोजना पृष्ठ


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एबी इंटरनेट नेटवर्क 2008 SL
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।