DuckDB, një DB me burim të hapur që përdoret nga Google, Facebook dhe Airbnb

DuckDB, DBMS e përdorur nga Google, Facebook dhe Airbnb

DuckDB është një sistem i menaxhimit të bazës së të dhënave SQL OLAP në zhvillim e sipër

kohët e fundit u njoftua lëshimi i versionit të ri të DuckDB 0.5.0, i cili është një sistem menaxhimi i bazës së të dhënave analitike në zhvillim (DBMS) i përdorur nga Google, Facebook dhe Airbnb.

DuckDB është një sistem i bazës së të dhënave analitike me performancë të lartë. Është projektuar të jetë i shpejtë, i besueshëm dhe i lehtë për t'u përdorur. DuckDB ofron një dialekt të pasur të SQL, me mbështetje shumë përtej SQL bazë. DuckDB mbështet pyetjet arbitrare dhe të ndërlidhura të ndërlidhura, funksionet e dritareve, grupimet, llojet komplekse (vargjet, strukturat) dhe më shumë.

Ndër karakteristikat kryesore të tij, dallohen këto:

  • Instalim i thjeshtë
  • I integruar: nuk ka menaxhim të serverit
  • Formati i ruajtjes së skedarit të vetëm
  • Përpunim i shpejtë analitik
  • Transferim i shpejtë midis R/Python dhe RDBMS
  • Nuk varet nga asnjë gjendje e jashtme. Për shembull, skedarë të veçantë të konfigurimit, ndryshore mjedisore.
  • Formati i ruajtjes së skedarit të vetëm
  • Ndërfaqe e kompozueshme. API programatike e rrjedhshme SQL
  • Plotësisht ACID nëpërmjet MVCC

Rreth DuckDB 0.5.0

Ndër risitë është "out of the core", i cili synon të zgjidhë problemet që mund të lindin kur të dhënat që përpunohen janë më të mëdha se memoria duke propozuar rezultate të ndërmjetme..

Versioni i ri përdor indekset Adaptive Radix Tree (ART). për të aplikuar kufizime dhe për të përshpejtuar filtrat e pyetjeve. Deri më tani, indekset nuk ishin të vazhdueshme, duke çuar në probleme të tilla si humbja e informacionit të indeksit dhe kohët e gjata të rifreskimit për tabelat e kufizuara nga të dhënat.

ART në thelb është një përpjekje për të aplikuar kompresim vertikal dhe horizontal për të krijuar struktura indeksi kompakte. Synimet janë struktura të dhënash të ngjashme me pemën, ku çdo nivel i pemës përmban informacione për një pjesë të grupit të të dhënave. Ato zakonisht ilustrohen me vargje karakteresh.

Projekti shtoi gjithashtu optimizimin e rendit të bashkimit, një problem i zakonshëm në bazat e të dhënave analitike. Hyoun Park, CEO dhe Krye Analist në Amalgam Insights, tha se diferencimi i DuckDB vjen nga fakti se ai është një aplikacion i vogël që funksionon brenda flukseve të punës të bazuara në kod për të skanuar shpejt dyqanet e mëdha të të dhënave.

“DuckDB shpesh mund të ekzekutojë pyetje direkt në të dhëna pa përpunim të ndërmjetëm, gjë që përmirëson përpunimin. Nga një këndvështrim thjesht teknologjik, ai është disi i ngjashëm me Actian Vector, i cili gjithashtu merr një qasje të pyetësorit të vektorizuar në kolonë, megjithëse Actian është krijuar për të marrë të dhëna në vend që të punojë në një proces ose të ngarkojë një punë specifike. »

DuckDB Labs ofron këshilla dhe mbështetje. Bashkëthemeluesi dhe CEO Hannes Mühleisen, i cili gjithashtu bashkë-shkruan kodin dhe mirëmban projektin, tha se ishte frymëzuar nga SQLite, motori i bazës së të dhënave OLTP pa server, ku ai pa një mundësi për një qasje të ngjashme, por për analitikë.

DuckDB përdoret gjithashtu shpesh si pjesë e një rafte analitike ose menaxhimi. të dhëna më të mëdha. Për shembull, nëse dikush ndërton një aplikacion të personalizuar që mbledh të dhëna dhe më pas dëshiron të krijojë një ndërfaqe SQL, së pari duhet t'i kopjojë të dhënat dhe t'i zhvendosë në një sistem tjetër, gjë që mund të shkaktojë probleme sinkronizimi, shpjegoi ai.

Shkarkoni dhe merrni

Është e rëndësishme të përmendet se faqja kryesore thotë qartë se nuk duhet të përdoret për "instalime të mëdha klient/server për ruajtjen e centralizuar të të dhënave të ndërmarrjes".

Projekti po punon në lëshimin e versionit 1.0, pas së cilës nuk do të jetë më e mundur të bëhen ndryshime. Punimet e akademikëve të Qendrës për Matematikën dhe Shkencën Teorike Kompjuterike Centrum Wiskunde & Informatica në Amsterdam, DuckDB janë integruar në një proces pritës, vlen të përmendet se nuk ka asnjë softuer të serverit DBMS për të instaluar, përditësuar ose mirëmbajtur.

Për shembull, paketa DuckDB Python mund të ekzekutojë pyetje direkt në të dhëna nga biblioteka e softuerit Python, pa importuar ose kopjuar të dhëna. DuckDB është shkruar në C++, është falas dhe me burim të hapur nën licencën MIT.

Mund të mësoni më shumë rreth tij si dhe të konsultoni manualin e instalimit, Në lidhjen vijuese.


Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: AB Internet Networks 2008 SL
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.