DuckDB, en open source DB, der bruges af Google, Facebook og Airbnb

DuckDB, DBMS, der bruges af Google, Facebook og Airbnb

DuckDB er et SQL OLAP-databasestyringssystem under udvikling

nylig udgivelsen af ​​den nye version af DuckDB 0.5.0 blev annonceret, som er et udviklende analysedatabasestyringssystem (DBMS), der bruges af Google, Facebook og Airbnb.

AndDB er et højtydende analytisk databasesystem. Den er designet til at være hurtig, pålidelig og nem at bruge. DuckDB giver en rig dialekt af SQL, med understøttelse langt ud over grundlæggende SQL. DuckDB understøtter vilkårlige og indlejrede korrelerede underforespørgsler, vinduesfunktioner, kollationer, komplekse typer (arrays, strukturer) og mere.

Blandt dens vigtigste egenskaber er følgende:

  • Instalación enkel
  • Integreret: ingen serverstyring
  • Enkelt fil lagringsformat
  • Hurtig analytisk behandling
  • Hurtig overførsel mellem R/Python og RDBMS
  • Det afhænger ikke af nogen ekstern tilstand. For eksempel separate konfigurationsfiler, miljøvariabel.
  • Enkelt fil lagringsformat
  • Komponerbar grænseflade. Flydende SQL Programmatic API
  • Fuldt SYRE via MVCC

Om DuckDB 0.5.0

Blandt nyhederne er "out of core", som har til formål at løse de problemer, der kan opstå, når de data, der behandles, er større end hukommelsen ved at foreslå mellemresultater.

Den nye version bruger Adaptive Radix Tree (ART) indekser at anvende begrænsninger og fremskynde forespørgselsfiltre. Indtil nu var indekser ikke vedvarende, hvilket førte til problemer som tab af indeksoplysninger og lange genindlæsningstider for databegrænsede tabeller.

ART det er i bund og grund et forsøg på at anvende lodret og vandret komprimering for at skabe kompakte indeksstrukturer. Hensigter er trælignende datastrukturer, hvor hvert niveau i træet indeholder information om en del af datasættet. De er normalt illustreret med tegnstrenge.

Projektet tilføjede også joinordreoptimering, et almindeligt problem i analytiske databaser. Hyoun Park, CEO og Chief Analyst hos Amalgam Insights, sagde, at DuckDBs differentiering kommer fra det faktum, at det er en lille applikation, der arbejder inden for kodebaserede arbejdsgange til hurtigt at scanne store datalagre.

“DuckDB kan ofte køre forespørgsler direkte på dataene uden mellemliggende behandling, hvilket forbedrer behandlingen. Fra et rent teknologisk synspunkt ligner det noget Actian Vector, som også tager en kolonneformet vektoriseret OLAP-forespørgselstilgang, selvom Actian er designet til at hente data i stedet for at arbejde på en proces eller indlæse et specifikt job. »

DuckDB Labs giver råd og support. Medstifter og administrerende direktør Hannes Mühleisen, som også var med til at skrive koden og vedligeholde projektet, sagde, at han var inspireret af SQLite, den serverløse OLTP-databasemotor, hvor han så en mulighed for en lignende tilgang, men for analyser.

DuckDB bruges også ofte som en del af en analyse- eller administrationsstak. større data. For eksempel, hvis nogen bygger en brugerdefineret applikation, der indsamler data og derefter vil oprette en SQL-grænseflade, skulle de først kopiere dataene og flytte dem til et andet system, hvilket kunne forårsage synkroniseringsproblemer, forklarede han.

Download og hent

Det er vigtigt at nævne, at hjemmesiden tydeligt angiver, at den ikke bør bruges til "store klient/server-installationer til centraliseret virksomhedsdatalagring".

Projektet arbejder på udgivelsen af ​​version 1.0, hvorefter det ikke længere vil være muligt at foretage ændringer. Arbejderne fra akademikerne fra Center for Matematik og Teoretisk Computer Science Centrum Wiskunde & Informatica i Amsterdam, DuckDB er integreret i en værtsproces, det er værd at bemærke, at der ikke er nogen DBMS-serversoftware til at installere, opdatere eller vedligeholde.

For eksempel kan DuckDB Python-pakken køre forespørgsler direkte på data fra Python-softwarebiblioteket uden at importere eller kopiere data. DuckDB er skrevet i C++, er gratis og open source under MIT-licensen.

Du kan lære mere om det samt se installationsmanualen, I det følgende link.


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for data: AB Internet Networks 2008 SL
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.