DuckDB minangka sistem manajemen database SQL OLAP sing lagi digawe
Bubar release saka versi anyar DuckDB 0.5.0 iki announced, yaiku sistem manajemen basis data analytics (DBMS) ngembangake sing digunakake dening Google, Facebook, lan Airbnb.
DuckDB minangka sistem basis data analitik kinerja dhuwur. Iki dirancang supaya cepet, dipercaya, lan gampang digunakake. DuckDB nyedhiyakake dialek SQL sing sugih, kanthi dhukungan sing ngluwihi SQL dhasar. DuckDB ndhukung subqueries sing sewenang-wenang lan nested, fungsi jendhela, collations, jinis Komplek (arrays, structs), lan liyane.
Antarane ciri utama, ing ngisor iki katon:
- Instalasi sing gampang
- Integrasi: ora ana manajemen server
- Format panyimpenan file tunggal
- Pangolahan analitis kanthi cepet
- Transfer cepet antarane R / Python lan RDBMS
- Iku ora gumantung ing sembarang negara njaba. Contone, file konfigurasi kapisah, variabel lingkungan.
- Format panyimpenan file tunggal
- Antarmuka sing bisa digabung. Fluent SQL Programmatic API
- Full ACID liwat MVCC
Babagan DuckDB 0.5.0
Antarane novelties "out of core", sing tujuane kanggo ngatasi masalah sing bisa kedadeyan nalika data sing diproses luwih gedhe tinimbang memori kanthi ngusulake asil penengah..
Versi anyar nggunakake indeks Adaptive Radix Tree (ART). kanggo ngetrapake watesan lan nyepetake saringan pitakon. Nganti saiki, indeks ora terus-terusan, nyebabake masalah kayata kelangan informasi indeks lan wektu muat ulang sing dawa kanggo tabel sing dibatasi data.
ART iku, ing intine, nyoba kanggo aplikasi komprèsi vertikal lan horisontal kanggo nggawe struktur indeks kompak. Maksud minangka struktur data kaya wit, ing ngendi saben level wit ngemot informasi babagan sawetara bagean saka set data. Padha biasane digambarake dening strings karakter.
Proyek kasebut uga nambahake optimasi pesenan gabung, masalah umum ing basis data analitis. Hyoun Park, CEO lan Kepala Analyst ing Amalgam Insights, ngandika sing diferensiasi DuckDB asalé saka kasunyatan sing iku aplikasi cilik sing dianggo ing alur kerja basis kode kanggo cepet mindai nyimpen gedhe data.
"DuckDB asring bisa mbukak pitakon langsung ing data tanpa proses penengah, sing nambah pangolahan. Saka sudut pandang teknologi murni, meh padha karo Actian Vector, sing uga njupuk pendekatan query OLAP vectorized columnar, sanajan Actian dirancang kanggo njupuk data tinimbang nggarap proses utawa mbukak proyek tartamtu. »
DuckDB Labs menehi saran lan dhukungan. Co-founder lan CEO Hannes Mühleisen, sing uga nulis kode lan njaga proyek kasebut, ujar manawa dheweke diilhami dening SQLite, mesin database OLTP tanpa server, ing ngendi dheweke weruh kesempatan kanggo pendekatan sing padha, nanging kanggo analytics.
DuckDB uga asring digunakake minangka bagean saka analytics utawa tumpukan manajemen. data luwih gedhe. Contone, yen ana wong sing nggawe aplikasi khusus sing nglumpukake data banjur pengin nggawe antarmuka SQL, mula kudu nyalin data kasebut lan pindhah menyang sistem liyane, sing bisa nyebabake masalah sinkronisasi, ujare.
Download lan entuk
Penting kanggo nyebutake manawa kaca ngarep kasebut kanthi jelas nyatakake yen ora bisa digunakake kanggo "instalasi klien / server gedhe kanggo panyimpenan data perusahaan terpusat".
Proyek iki nggarap rilis versi 1.0, sawise iku ora bisa maneh kanggo nggawe owah-owahan. Karya akademisi Pusat Matematika lan Ilmu Komputer Teoritis Centrum Wiskunde & Informatica ing Amsterdam, DuckDB digabungake menyang proses host, kudu dicathet yen ora ana piranti lunak server DBMS kanggo nginstal, nganyari utawa njaga.
Contone, paket DuckDB Python bisa mbukak pitakon langsung ing data saka perpustakaan piranti lunak Python, tanpa ngimpor utawa nyalin data. DuckDB ditulis ing C ++, gratis lan open source miturut lisensi MIT.
Sampeyan bisa sinau luwih lengkap babagan iki uga takon manual instalasi, Ing link ing ngisor iki.
Dadi pisanan komentar