DuckDB, DB open source yang digunakan oleh Google, Facebook, dan Airbnb

DuckDB, DBMS yang digunakan oleh Google, Facebook, dan Airbnb

DuckDB adalah sistem manajemen database SQL OLAP dalam pembuatan

Baru-baru ini rilis versi baru DuckDB 0.5.0 diumumkan, yang merupakan pengembangan sistem manajemen basis data analitik (DBMS) yang digunakan oleh Google, Facebook, dan Airbnb.

BebekDB adalah sistem database analitik berkinerja tinggi. Ini dirancang agar cepat, andal, dan mudah digunakan. DuckDB menyediakan dialek SQL yang kaya, dengan dukungan jauh melampaui SQL dasar. DuckDB mendukung subkueri berkorelasi arbitrer dan bersarang, fungsi jendela, susunan, tipe kompleks (array, struct), dan banyak lagi.

Di antara karakteristik utamanya, berikut ini menonjol:

  • Instalasi sederhana
  • Terintegrasi: tidak ada manajemen server
  • Format penyimpanan file tunggal
  • Pemrosesan analitik cepat
  • Transfer cepat antara R/Python dan RDBMS
  • Itu tidak tergantung pada keadaan eksternal apa pun. Misalnya, file konfigurasi terpisah, variabel lingkungan.
  • Format penyimpanan file tunggal
  • Antarmuka yang dapat dikomposisi. API Terprogram SQL Lancar
  • Sepenuhnya ASAM melalui MVCC

Tentang DuckDB 0.5.0

Di antara hal baru adalah "out of core", yang bertujuan untuk memecahkan masalah yang mungkin muncul ketika data yang diproses lebih besar dari memori dengan mengusulkan hasil antara.

Versi baru menggunakan indeks Adaptive Radix Tree (ART) untuk menerapkan batasan dan mempercepat filter kueri. Hingga saat ini, indeks tidak persisten, yang menyebabkan masalah seperti hilangnya informasi indeks dan waktu muat ulang yang lama untuk tabel yang dibatasi data.

SENI(ART) itu, pada dasarnya, merupakan upaya untuk menerapkan kompresi vertikal dan horizontal untuk membuat struktur indeks yang kompak. Maksud adalah struktur data seperti pohon, di mana setiap tingkat pohon berisi informasi tentang beberapa bagian dari kumpulan data. Mereka biasanya diilustrasikan oleh string karakter.

Proyek ini juga menambahkan pengoptimalan pesanan bergabung, masalah umum dalam database analitik. Hyoun Park, CEO dan Kepala Analis di Amalgam Insights, mengatakan bahwa diferensiasi DuckDB berasal dari fakta bahwa itu adalah aplikasi kecil yang bekerja dalam alur kerja berbasis kode untuk memindai penyimpanan data yang besar dengan cepat.

“DuckDB sering dapat menjalankan kueri langsung pada data tanpa pemrosesan perantara, yang meningkatkan pemrosesan. Dari sudut pandang teknologi murni, ini agak mirip dengan Actian Vector, yang juga menggunakan pendekatan kueri OLAP vektor kolumnar, meskipun Actian dirancang untuk mengambil data daripada mengerjakan suatu proses atau memuat pekerjaan tertentu. »

DuckDB Labs memberikan saran dan dukungan. Co-founder dan CEO Hannes Mühleisen, yang juga ikut menulis kode dan mengelola proyek tersebut, mengatakan bahwa dia terinspirasi oleh SQLite, mesin database OLTP tanpa server, di mana dia melihat peluang untuk pendekatan serupa, tetapi untuk analitik.

DuckDB juga sering digunakan sebagai bagian dari analitik atau tumpukan manajemen. data yang lebih besar. Misalnya, jika seseorang membangun aplikasi khusus yang mengumpulkan data dan kemudian ingin membuat antarmuka SQL, mereka harus menyalin data terlebih dahulu dan memindahkannya ke sistem lain, yang dapat menyebabkan masalah sinkronisasi, jelasnya.

Unduh dan dapatkan

Penting untuk disebutkan bahwa halaman beranda dengan jelas menyatakan bahwa itu tidak boleh digunakan untuk "instalasi klien/server besar untuk penyimpanan data perusahaan terpusat".

Proyek ini sedang mengerjakan rilis versi 1.0, setelah itu tidak mungkin lagi melakukan perubahan. Karya akademisi Pusat Matematika dan Ilmu Komputer Teoritis Centrum Wiskunde & Informatica di Amsterdam, DuckDB terintegrasi ke dalam proses host, perlu dicatat bahwa tidak ada perangkat lunak server DBMS untuk menginstal, memperbarui, atau memelihara.

Misalnya, paket DuckDB Python dapat menjalankan kueri langsung pada data dari pustaka perangkat lunak Python, tanpa mengimpor atau menyalin data. DuckDB ditulis dalam C++, gratis dan open source di bawah lisensi MIT.

Anda dapat mempelajari lebih lanjut tentang itu serta berkonsultasi dengan manual instalasi, Di tautan berikut.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Bertanggung jawab atas data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.