DuckDB, Google, Facebook आणि Airbnb द्वारे वापरलेला मुक्त स्रोत DB

DuckDB, Google, Facebook आणि Airbnb द्वारे वापरलेला DBMS

डकडीबी ही एक SQL OLAP डेटाबेस व्यवस्थापन प्रणाली आहे

अलीकडे DuckDB 0.5.0 च्या नवीन आवृत्तीचे प्रकाशन घोषित करण्यात आले, जी Google, Facebook आणि Airbnb द्वारे वापरली जाणारी विकसनशील विश्लेषण डेटाबेस व्यवस्थापन प्रणाली (DBMS) आहे.

डकडीबी एक उच्च-कार्यक्षमता विश्लेषणात्मक डेटाबेस प्रणाली आहे. हे जलद, विश्वासार्ह आणि वापरण्यास सोपा असण्यासाठी डिझाइन केले आहे. डकडीबी एसक्यूएलची समृद्ध बोली प्रदान करते, ज्यात मूलभूत SQL च्या पलीकडे समर्थन आहे. DuckDB अनियंत्रित आणि नेस्टेड सहसंबंधित सबक्वेरी, विंडो फंक्शन्स, कोलेशन्स, कॉम्प्लेक्स प्रकार (अॅरे, स्ट्रक्चर्स) आणि बरेच काही समर्थन करते.

त्याच्या मुख्य वैशिष्ट्यांपैकी, खालील गोष्टी स्पष्ट आहेत:

  • साधी स्थापना
  • समाकलित: कोणतेही सर्व्हर व्यवस्थापन नाही
  • सिंगल फाइल स्टोरेज फॉरमॅट
  • वेगवान विश्लेषणात्मक प्रक्रिया
  • R/Python आणि RDBMS दरम्यान जलद हस्तांतरण
  • हे कोणत्याही बाह्य स्थितीवर अवलंबून नाही. उदाहरणार्थ, स्वतंत्र कॉन्फिगरेशन फाइल्स, पर्यावरण व्हेरिएबल.
  • सिंगल फाइल स्टोरेज फॉरमॅट
  • कंपोझेबल इंटरफेस. अस्खलित SQL प्रोग्रामॅटिक API
  • MVCC द्वारे पूर्णपणे ACID

डकडीबी 0.5.0 बद्दल

नॉव्हेल्टीपैकी "आऊट ऑफ कोअर" आहे, ज्याचा उद्देश मध्यवर्ती निकाल प्रस्तावित करून प्रक्रिया केलेला डेटा मेमरीपेक्षा मोठा असताना उद्भवू शकणार्‍या समस्यांचे निराकरण करणे आहे..

नवीन आवृत्ती अडॅप्टिव्ह रेडिक्स ट्री (एआरटी) निर्देशांक वापरते निर्बंध लागू करण्यासाठी आणि क्वेरी फिल्टरला गती देण्यासाठी. आत्तापर्यंत, निर्देशांक स्थिर नव्हते, ज्यामुळे निर्देशांक माहिती गमावणे आणि डेटा-प्रतिबंधित तक्त्यांसाठी दीर्घ रीलोड वेळ यासारख्या समस्या उद्भवल्या.

ART थोडक्यात, कॉम्पॅक्ट इंडेक्स स्ट्रक्चर्स तयार करण्यासाठी अनुलंब आणि क्षैतिज कॉम्प्रेशन लागू करण्याचा हा एक प्रयत्न आहे. इंटेंट्स हे झाडासारख्या डेटा स्ट्रक्चर्स असतात, जिथे झाडाच्या प्रत्येक स्तरामध्ये डेटा सेटच्या काही भागाची माहिती असते. ते सहसा वर्ण स्ट्रिंगद्वारे स्पष्ट केले जातात.

प्रकल्पाने जॉईन ऑर्डर ऑप्टिमायझेशन देखील जोडले, विश्लेषणात्मक डेटाबेसमधील एक सामान्य समस्या. Amalgam Insights चे CEO आणि मुख्य विश्लेषक ह्यून पार्क म्हणाले की, DuckDB चे वेगळेपण या वस्तुस्थितीवरून आले आहे की हे एक लहान ऍप्लिकेशन आहे जे कोड-आधारित वर्कफ्लोमध्ये डेटाचे मोठे स्टोअर द्रुतपणे स्कॅन करण्यासाठी कार्य करते.

“डकडीबी अनेकदा इंटरमीडिएट प्रोसेसिंगशिवाय डेटावर थेट क्वेरी चालवू शकते, ज्यामुळे प्रक्रिया सुधारते. पूर्णपणे तांत्रिक दृष्टीकोनातून, हे काहीसे अॅक्टिअन वेक्टरसारखेच आहे, जे स्तंभीय वेक्टराइज्ड OLAP क्वेरी दृष्टिकोन देखील घेते, जरी Actian हे प्रक्रियेवर काम करण्याऐवजी किंवा विशिष्ट काम लोड करण्याऐवजी डेटा आणण्यासाठी डिझाइन केलेले आहे. »

डकडीबी लॅब सल्ला आणि समर्थन प्रदान करते. सह-संस्थापक आणि CEO Hannes Mühleisen, ज्यांनी सह-लेखन देखील केले आणि प्रकल्पाची देखरेख केली, म्हणाले की ते SQLite, सर्व्हरलेस OLTP डेटाबेस इंजिनपासून प्रेरित आहेत, जिथे त्यांना समान दृष्टिकोनाची संधी दिसली, परंतु विश्लेषणासाठी.

डकडीबीचा वापर अनेकदा विश्लेषण किंवा व्यवस्थापन स्टॅकचा भाग म्हणून केला जातो. मोठा डेटा. उदाहरणार्थ, जर एखाद्याने डेटा संकलित करणारा सानुकूल अनुप्रयोग तयार केला आणि नंतर SQL इंटरफेस तयार करायचा असेल, तर त्यांना प्रथम डेटा कॉपी करून दुसर्‍या सिस्टममध्ये हलवावा लागेल, ज्यामुळे सिंक्रोनाइझेशन समस्या उद्भवू शकतात, त्यांनी स्पष्ट केले.

डाउनलोड करा आणि मिळवा

हे नमूद करणे महत्त्वाचे आहे की मुख्यपृष्ठ स्पष्टपणे नमूद करते की ते "केंद्रीकृत एंटरप्राइझ डेटा स्टोरेजसाठी मोठ्या क्लायंट/सर्व्हर स्थापनेसाठी" वापरले जाऊ नये.

प्रकल्प आवृत्ती 1.0 च्या प्रकाशनावर काम करत आहे, त्यानंतर बदल करणे शक्य होणार नाही. Amsterdam, DuckDB मधील सेंटर फॉर मॅथेमॅटिक्स अँड थिओरेटिकल कॉम्प्युटर सायन्स सेंट्रम विस्कुंडे आणि इन्फॉर्मेटिका यांच्या शैक्षणिक कार्ये होस्ट प्रक्रियेत समाकलित केली गेली आहेत, हे लक्षात घेण्यासारखे आहे की स्थापित, अद्यतनित किंवा देखरेख करण्यासाठी कोणतेही DBMS सर्व्हर सॉफ्टवेअर नाही.

उदाहरणार्थ, डकडीबी पायथन पॅकेज डेटा आयात किंवा कॉपी न करता, पायथन सॉफ्टवेअर लायब्ररीमधील डेटावर थेट क्वेरी चालवू शकते. DuckDB C++ मध्ये लिहिलेले आहे, MIT परवान्याअंतर्गत विनामूल्य आणि मुक्त स्रोत आहे.

तुम्ही त्याबद्दल अधिक जाणून घेऊ शकता तसेच इन्स्टॉलेशन मॅन्युअलचा सल्ला घेऊ शकता, पुढील लिंकवर


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटासाठी जबाबदार: AB इंटरनेट नेटवर्क 2008 SL
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.