DuckDB, avatud lähtekoodiga DB, mida kasutavad Google, Facebook ja Airbnb

DuckDB, DBMS, mida kasutavad Google, Facebook ja Airbnb

DuckDB on loomisel olev SQL OLAP-i andmebaasihaldussüsteem

Hiljuti teatati DuckDB 0.5.0 uue versiooni väljaandmisest, mis on arenev analüütilise andmebaasi haldussüsteem (DBMS), mida kasutavad Google, Facebook ja Airbnb.

DuckDB on suure jõudlusega analüütiline andmebaasisüsteem. See on loodud nii, et see oleks kiire, usaldusväärne ja hõlpsasti kasutatav. DuckDB pakub rikkalikku SQL-i dialekti, mille tugi on palju suurem kui põhiline SQL. DuckDB toetab suvalisi ja pesastatud korrelatsiooni alampäringuid, aknafunktsioone, võrdlemisi, keerulisi tüüpe (massiivid, struktuurid) ja palju muud.

Selle peamiste omaduste hulgas eristuvad järgmised omadused:

  • Lihtne paigaldus
  • Integreeritud: serverihaldus puudub
  • Ühe faili salvestusvorming
  • Kiire analüütiline töötlemine
  • Kiire ülekanne R/Pythoni ja RDBMS-i vahel
  • See ei sõltu ühestki välisest olekust. Näiteks eraldi konfiguratsioonifailid, keskkonnamuutuja.
  • Ühe faili salvestusvorming
  • Komponeeritav liides. Ladus SQL-i programmiline API
  • Täielikult ACID MVCC kaudu

DuckDB 0.5.0 kohta

Uudsuste hulgas on ka "out of core", mille eesmärk on vahetulemuste pakkumisega lahendada probleemid, mis võivad tekkida, kui töödeldavad andmed on mälust suuremad..

Uus versioon kasutab Adaptive Radix Tree (ART) indekseid piirangute rakendamiseks ja päringufiltrite kiirendamiseks. Seni ei olnud indeksid püsivad, mis põhjustas selliseid probleeme nagu indeksi teabe kadu ja andmepiiranguga tabelite pikk uuesti laadimisaeg.

ART see on sisuliselt katse rakendada vertikaalset ja horisontaalset tihendamist kompaktsete indeksstruktuuride loomiseks. Kavatsused on puutaolised andmestruktuurid, kus iga puu tase sisaldab teavet andmestiku mõne osa kohta. Tavaliselt illustreeritakse neid märgistringidega.

Projekt lisas ka liitumistellimuste optimeerimise, analüütilistes andmebaasides levinud probleem. Amalgam Insightsi tegevjuht ja peaanalüütik Hyoun Park ütles, et DuckDB eristus tuleneb asjaolust, et see on väike rakendus, mis töötab koodipõhistes töövoogudes, et kiiresti skannida suuri andmesalve.

"DuckDB saab sageli käivitada päringuid otse andmetele ilma vahepealse töötlemiseta, mis parandab töötlemist. Puhtalt tehnoloogilisest vaatenurgast on see mõnevõrra sarnane Actian Vectoriga, mis kasutab samuti veergude vektoriseeritud OLAP-päringu lähenemisviisi, kuigi Actian on mõeldud pigem andmete toomiseks kui protsessi kallal töötamiseks või konkreetse töö laadimiseks. »

DuckDB Labs pakub nõu ja tuge. Kaasasutaja ja tegevjuht Hannes Mühleisen, kes ka koodi kirjutas ja projekti haldab, ütles, et sai inspiratsiooni serverita OLTP andmebaasimootorist SQLite, kus ta nägi võimalust sarnaseks lähenemiseks, kuid analüütikaks.

DuckDB-d kasutatakse sageli ka analüütika- või halduspinu osana. suuremaid andmeid. Näiteks kui keegi koostab kohandatud rakenduse, mis kogub andmeid ja soovib seejärel luua SQL-liidese, pidi ta esmalt andmed kopeerima ja teise süsteemi teisaldama, mis võib põhjustada sünkroonimisprobleeme, selgitas ta.

Laadige alla ja hankige

Oluline on mainida, et avalehel on selgelt kirjas, et seda ei tohiks kasutada "suurte kliendi/serveri installatsioonide jaoks tsentraliseeritud ettevõtte andmete salvestamiseks".

Projekt töötab versiooni 1.0 väljalaske kallal, pärast mida pole enam võimalik muudatusi teha. Amsterdami matemaatika ja teoreetilise arvutiteaduse keskuse Centrum Wiskunde & Informatica, DuckDB akadeemikute tööd on integreeritud hostprotsessi, väärib märkimist, et DBMS-i serveritarkvara installimiseks, värskendamiseks või hooldamiseks pole.

Näiteks DuckDB Pythoni pakett võib käitada päringuid otse Pythoni tarkvarateegi andmetele, ilma andmeid importimata või kopeerimata. DuckDB on kirjutatud C++ keeles, on tasuta ja avatud lähtekoodiga MIT litsentsi all.

Saate selle kohta lisateavet ja tutvuda paigaldusjuhendiga, Järgmisel lingil.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.