DuckDB, isang open source DB na ginagamit ng Google, Facebook at Airbnb

DuckDB, ang DBMS na ginagamit ng Google, Facebook at Airbnb

Ang DuckDB ay isang SQL OLAP database management system sa paggawa

Kamakailan lamang ang paglabas ng bagong bersyon ng DuckDB 0.5.0 ay inihayag, na isang pagbuo ng analytics database management system (DBMS) na ginagamit ng Google, Facebook, at Airbnb.

DuckDB ay isang high-performance analytical database system. Ito ay dinisenyo upang maging mabilis, maaasahan, at madaling gamitin. Nagbibigay ang DuckDB ng mayamang diyalekto ng SQL, na may suportang higit pa sa pangunahing SQL. Sinusuportahan ng DuckDB ang mga arbitrary at nested correlated na subquery, mga function ng window, collation, kumplikadong uri (mga array, struct), at higit pa.

Kabilang sa mga pangunahing katangian nito, ang mga sumusunod ay namumukod-tangi:

  • Simpleng pag-install
  • Pinagsama: walang pamamahala ng server
  • Isang format ng imbakan ng file
  • Mabilis na analytical processing
  • Mabilis na paglipat sa pagitan ng R/Python at RDBMS
  • Hindi ito nakasalalay sa anumang panlabas na estado. Halimbawa, hiwalay na configuration file, environment variable.
  • Isang format ng imbakan ng file
  • Composable na interface. Fluent SQL Programmatic API
  • Ganap na ACID sa pamamagitan ng MVCC

Tungkol sa DuckDB 0.5.0

Kabilang sa mga novelty ay "out of core", na naglalayong lutasin ang mga problema na maaaring lumitaw kapag ang data na pinoproseso ay mas malaki kaysa sa memorya sa pamamagitan ng pagmumungkahi ng mga intermediate na resulta.

Ang bagong bersyon gumagamit ng mga index ng Adaptive Radix Tree (ART). upang maglapat ng mga paghihigpit at pabilisin ang mga filter ng query. Hanggang ngayon, ang mga index ay hindi nagpapatuloy, na humahantong sa mga isyu tulad ng pagkawala ng impormasyon ng index at mahabang oras ng pag-reload para sa mga talahanayan na pinigilan ng data.

Sining ito ay, sa esensya, isang pagtatangka na maglapat ng patayo at pahalang na compression upang lumikha ng mga compact index na istruktura. Ang mga layunin ay mga istruktura ng data na parang puno, kung saan ang bawat antas ng puno ay naglalaman ng impormasyon tungkol sa ilang bahagi ng set ng data. Karaniwang inilalarawan ang mga ito sa pamamagitan ng mga string ng character.

Nagdagdag din ang proyekto ng join order optimization, isang karaniwang problema sa analytical database. Sinabi ni Hyoun Park, CEO at Chief Analyst sa Amalgam Insights, na ang pagkakaiba ng DuckDB ay nagmumula sa katotohanan na ito ay isang maliit na application na gumagana sa loob ng mga workflow na nakabatay sa code upang mabilis na mai-scan ang malalaking tindahan ng data.

"Ang DuckDB ay kadalasang maaaring magpatakbo ng mga query nang direkta sa data na walang intermediate na pagproseso, na nagpapabuti sa pagproseso. Mula sa isang purong teknolohikal na pananaw, ito ay medyo katulad sa Actian Vector, na kumukuha din ng isang columnar vectorized na OLAP na diskarte sa query, bagama't ang Actian ay idinisenyo upang kumuha ng data sa halip na magtrabaho sa isang proseso o mag-load ng isang partikular na trabaho. »

Nagbibigay ang DuckDB Labs ng payo at suporta. Ang co-founder at CEO na si Hannes Mühleisen, na kasama ring sumulat ng code at nagpapanatili ng proyekto, ay nagsabi na siya ay inspirasyon ng SQLite, ang serverless OLTP database engine, kung saan nakakita siya ng pagkakataon para sa isang katulad na diskarte, ngunit para sa analytics.

Madalas ding ginagamit ang DuckDB bilang bahagi ng analytics o management stack. mas malaking data. Halimbawa, kung may bumuo ng custom na application na nangongolekta ng data at pagkatapos ay gustong gumawa ng SQL interface, kailangan muna nilang kopyahin ang data at ilipat ito sa ibang system, na maaaring magdulot ng mga isyu sa pag-synchronize, paliwanag niya.

Mag-download at makakuha

Mahalagang banggitin na ang home page ay malinaw na nagsasaad na hindi ito dapat gamitin para sa "malaking client/server installation para sa sentralisadong enterprise data storage".

Gumagana ang proyekto sa pagpapalabas ng bersyon 1.0, pagkatapos nito ay hindi na posible na gumawa ng mga pagbabago. Ang mga gawa ng mga akademya ng Center for Mathematics at Theoretical Computer Science Centrum Wiskunde & Informatica sa Amsterdam, DuckDB ay isinama sa isang proseso ng host, ito ay nagkakahalaga ng noting na walang DBMS server software upang i-install, i-update o panatilihin.

Halimbawa, ang DuckDB Python package ay maaaring magpatakbo ng mga query nang direkta sa data mula sa Python software library, nang walang pag-import o pagkopya ng data. Ang DuckDB ay nakasulat sa C++, libre at open source sa ilalim ng lisensya ng MIT.

Maaari kang matuto nang higit pa tungkol dito pati na rin kumonsulta sa manu-manong pag-install, Sa sumusunod na link.


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: AB Internet Networks 2008 SL
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.