DuckDB ، قاعدة بيانات مفتوحة المصدر تستخدمها Google و Facebook و Airbnb

DuckDB ، نظام إدارة قواعد البيانات الذي تستخدمه Google و Facebook و Airbnb

DuckDB هو نظام إدارة قواعد بيانات SQL OLAP قيد الإعداد

مؤخرا تم الإعلان عن إصدار الإصدار الجديد من DuckDB 0.5.0، وهو نظام مطور لإدارة قواعد البيانات التحليلية (DBMS) تستخدمه Google و Facebook و Airbnb.

دك دي بي هو نظام قاعدة بيانات تحليلية عالي الأداء. تم تصميمه ليكون سريعًا وموثوقًا وسهل الاستخدام. يوفر DuckDB لهجة غنية من SQL ، مع دعم يتجاوز بكثير SQL الأساسية. يدعم DuckDB الاستعلامات الفرعية المترابطة العشوائية والمتداخلة ووظائف النوافذ وعمليات الترتيب والأنواع المعقدة (المصفوفات والبنى) والمزيد.

من بين خصائصه الرئيسية ما يلي:

  • Instalación بسيط
  • متكامل: لا يوجد إدارة للخادم
  • تنسيق تخزين ملف واحد
  • معالجة تحليلية سريعة
  • نقل سريع بين R / Python و RDBMS
  • لا تعتمد على أي دولة خارجية. على سبيل المثال ، ملفات تكوين منفصلة ، متغير البيئة.
  • تنسيق تخزين ملف واحد
  • واجهة قابلة للإنشاء. واجهة برمجة تطبيقات SQL برمجية بطلاقة
  • حمض بالكامل عبر MVCC

حول DuckDB 0.5.0

من بين المستجدات "خارج المركز" ، والذي يهدف إلى حل المشكلات التي قد تنشأ عندما تكون البيانات التي تتم معالجتها أكبر من الذاكرة من خلال اقتراح نتائج وسيطة.

النسخة الجديدة يستخدم فهارس Adaptive Radix Tree (ART) لتطبيق القيود وتسريع عوامل تصفية الاستعلام. حتى الآن ، لم تكن الفهارس ثابتة ، مما أدى إلى مشاكل مثل فقدان معلومات الفهرس وأوقات إعادة التحميل الطويلة للجداول المقيدة بالبيانات.

فن(ART) إنها ، في جوهرها ، محاولة لتطبيق ضغط رأسي وأفقي لإنشاء هياكل مؤشر مضغوطة. النوايا هي هياكل بيانات تشبه الشجرة ، حيث يحتوي كل مستوى من الشجرة على معلومات حول جزء من مجموعة البيانات. عادة ما يتم توضيحها بواسطة سلاسل الأحرف.

أضاف المشروع أيضًا تحسين ترتيب الانضمام، مشكلة شائعة في قواعد البيانات التحليلية. قال Hyoun Park ، الرئيس التنفيذي وكبير المحللين في Amalgam Insights ، إن تمايز DuckDB يأتي من حقيقة أنه تطبيق صغير يعمل ضمن تدفقات العمل القائمة على الكود لمسح مخازن كبيرة من البيانات بسرعة.

"يمكن لـ DuckDB في كثير من الأحيان تشغيل الاستعلامات مباشرة على البيانات بدون معالجة وسيطة ، مما يحسن المعالجة. من وجهة نظر تكنولوجية بحتة ، فهو يشبه إلى حد ما Actian Vector ، والذي يأخذ أيضًا منهج استعلام OLAP المتجه عموديًا ، على الرغم من أن Actian مصمم لجلب البيانات بدلاً من العمل على عملية أو تحميل وظيفة معينة. »

تقدم DuckDB Labs المشورة والدعم. قال المؤسس المشارك والرئيس التنفيذي Hannes Mühleisen ، الذي شارك أيضًا في كتابة الكود والحفاظ على المشروع ، إنه مستوحى من SQLite ، محرك قاعدة بيانات OLTP بدون خادم ، حيث رأى فرصة لاتباع نهج مماثل ، ولكن للتحليلات.

غالبًا ما يتم استخدام DuckDB كجزء من مجموعة التحليلات أو الإدارة. بيانات أكبر. على سبيل المثال ، إذا أنشأ شخص ما تطبيقًا مخصصًا يجمع البيانات ثم أراد إنشاء واجهة SQL ، فعليه أولاً نسخ البيانات ونقلها إلى نظام آخر ، مما قد يتسبب في حدوث مشكلات في المزامنة ، كما أوضح.

تنزيل والحصول على

من المهم الإشارة إلى أن الصفحة الرئيسية تنص بوضوح على أنه لا ينبغي استخدامها "لعمليات تثبيت العميل / الخادم الكبيرة لتخزين بيانات المؤسسة المركزية".

المشروع يعمل على اصدار النسخة 1.0، وبعد ذلك لن يكون من الممكن إجراء تغييرات. تم دمج أعمال الأكاديميين في مركز الرياضيات وعلوم الكمبيوتر النظري Centrum Wiskunde & Informatica في أمستردام ، DuckDB في عملية مضيفة ، ومن الجدير بالذكر أنه لا يوجد برنامج خادم DBMS للتثبيت أو التحديث أو الصيانة.

على سبيل المثال ، يمكن لحزمة DuckDB Python تشغيل الاستعلامات مباشرة على البيانات من مكتبة برامج Python ، دون استيراد البيانات أو نسخها. DuckDB مكتوب بلغة C ++ ، وهو مجاني ومفتوح المصدر بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.

يمكنك معرفة المزيد عنها وكذلك الرجوع إلى دليل التثبيت ، في الرابط التالي.


اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: AB Internet Networks 2008 SL
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.