DuckDB, en åpen kildekode-DB som brukes av Google, Facebook og Airbnb

DuckDB, DBMS som brukes av Google, Facebook og Airbnb

DuckDB er et SQL OLAP-databasestyringssystem under utvikling

nylig utgivelsen av den nye versjonen av DuckDB 0.5.0 ble annonsert, som er et utviklende analysedatabasestyringssystem (DBMS) som brukes av Google, Facebook og Airbnb.

DuckDB er et analytisk databasesystem med høy ytelse. Den er designet for å være rask, pålitelig og enkel å bruke. DuckDB gir en rik dialekt av SQL, med støtte langt utover grunnleggende SQL. DuckDB støtter vilkårlige og nestede korrelerte underspørringer, vindusfunksjoner, sammenstillinger, komplekse typer (matriser, strukturer) og mer.

Blant hovedkarakteristikkene skiller følgende seg ut:

  • Enkel installasjon
  • Integrert: ingen serveradministrasjon
  • Lagringsformat for enkeltfiler
  • Rask analytisk behandling
  • Rask overføring mellom R/Python og RDBMS
  • Det er ikke avhengig av noen ytre tilstand. For eksempel separate konfigurasjonsfiler, miljøvariabel.
  • Lagringsformat for enkeltfiler
  • Komponerbart grensesnitt. Flytende SQL Programmatic API
  • Helt SYRE via MVCC

Om DuckDB 0.5.0

Blant nyhetene er «out of core», som har som mål å løse problemene som kan oppstå når dataene som behandles er større enn minnet ved å foreslå mellomresultater.

Den nye versjonen bruker Adaptive Radix Tree (ART)-indekser å bruke begrensninger og øke hastigheten på søkefiltre. Inntil nå var indekser ikke vedvarende, noe som førte til problemer som tap av indeksinformasjon og lange omlastingstider for databegrensede tabeller.

ART det er i hovedsak et forsøk på å bruke vertikal og horisontal kompresjon for å lage kompakte indeksstrukturer. Hensikter er trelignende datastrukturer, der hvert nivå i treet inneholder informasjon om en del av datasettet. De er vanligvis illustrert med tegnstrenger.

Prosjektet la også til optimalisering av sammenføyningsordre, et vanlig problem i analytiske databaser. Hyoun Park, CEO og Chief Analyst hos Amalgam Insights, sa at DuckDBs differensiering kommer fra det faktum at det er en liten applikasjon som fungerer innenfor kodebaserte arbeidsflyter for raskt å skanne store datalagre.

"DuckDB kan ofte kjøre spørringer direkte på dataene uten mellombehandling, noe som forbedrer behandlingen. Fra et rent teknologisk synspunkt ligner det noe på Actian Vector, som også tar en kolonneformet vektorisert OLAP-spørringstilnærming, selv om Actian er designet for å hente data i stedet for å jobbe med en prosess eller laste inn en spesifikk jobb. »

DuckDB Labs gir råd og støtte. Medgründer og administrerende direktør Hannes Mühleisen, som også skrev koden og vedlikeholder prosjektet, sa at han var inspirert av SQLite, den serverløse OLTP-databasemotoren, hvor han så en mulighet for en lignende tilnærming, men for analyser.

DuckDB brukes også ofte som en del av en analyse- eller administrasjonsstabel. større data. For eksempel, hvis noen bygger en tilpasset applikasjon som samler inn data og deretter ønsker å lage et SQL-grensesnitt, måtte de først kopiere dataene og flytte dem til et annet system, noe som kan forårsake synkroniseringsproblemer, forklarte han.

Last ned og få

Det er viktig å nevne at hjemmesiden tydelig sier at den ikke skal brukes til "store klient/serverinstallasjoner for sentralisert bedriftsdatalagring".

Prosjektet jobber med utgivelsen av versjon 1.0, deretter vil det ikke lenger være mulig å gjøre endringer. Verkene til akademikerne ved Center for Mathematics and Theoretical Computer Science Centrum Wiskunde & Informatica i Amsterdam, DuckDB er integrert i en vertsprosess, det er verdt å merke seg at det ikke er noen DBMS-serverprogramvare å installere, oppdatere eller vedlikeholde.

For eksempel kan DuckDB Python-pakken kjøre spørringer direkte på data fra Python-programvarebiblioteket, uten å importere eller kopiere data. DuckDB er skrevet i C++, er gratis og åpen kildekode under MIT-lisensen.

Du kan lære mer om det, samt se installasjonsmanualen, I den følgende lenken.


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: AB Internet Networks 2008 SL
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.