DuckDB estas SQL OLAP datumbaza administradsistemo en kreado
Ĵus la liberigo de la nova versio de DuckDB 0.5.0 estis anoncita, kiu estas evoluiga analiza datumbaza administradsistemo (DBMS) uzita fare de Google, Facebook, kaj Airbnb.
DuckDB estas alt-efikeca analiza datumbaza sistemo. Ĝi estas desegnita por esti rapida, fidinda kaj facile uzebla. DuckDB provizas riĉan dialekton de SQL, kun subteno multe preter baza SQL. DuckDB subtenas arbitrajn kaj nestitajn korelaciitajn subdemandojn, fenestrajn funkciojn, kompatojn, kompleksajn tipojn (tabeloj, strukturoj), kaj pli.
Inter ĝiaj ĉefaj karakterizaĵoj elstaras jenaj:
- Simpla instalado
- Integrita: neniu servila administrado
- Ununura dosiera stokado formato
- Rapida analiza pretigo
- Rapida translokigo inter R/Python kaj RDBMS
- Ĝi ne dependas de iu ajn ekstera stato. Ekzemple, apartaj agordaj dosieroj, mediovariablo.
- Ununura dosiera stokado formato
- Komponebla interfaco. Flua SQL-Programa API
- Plene ACIDA per MVCC
Pri DuckDB 0.5.0
Inter la novecoj estas "el kerno", kiu celas solvi la problemojn kiuj povas aperi kiam la prilaborataj datumoj estas pli grandaj ol la memoro proponante mezajn rezultojn..
La nova versio uzas Adaptive Radix Tree (ART) indeksojn apliki limigojn kaj akceli demandajn filtrilojn. Ĝis nun, indeksoj ne estis persistaj, kondukante al problemoj kiel ekzemple perdo de indeksaj informoj kaj longaj reŝargaj tempoj por datum-limigitaj tabeloj.
ARTO ĝi estas, en esenco, provo apliki vertikalan kaj horizontalan kunpremadon por krei kompaktajn indeksstrukturojn. Intencoj estas arb-similaj datumstrukturoj, kie ĉiu nivelo de la arbo enhavas informojn pri iu parto de la datumaro. Ili estas kutime ilustritaj per signoŝnuroj.
La projekto ankaŭ aldonis aligordon-optimumigo, ofta problemo en analizaj datumbazoj. Hyoun Park, Ĉefoficisto kaj Ĉefa Analizisto ĉe Amalgam Insights, diris, ke la diferencigo de DuckDB venas de la fakto, ke ĝi estas malgranda aplikaĵo, kiu funkcias ene de kod-bazitaj laborfluoj por rapide skani grandajn butikojn de datumoj.
"DuckDB ofte povas fari demandojn rekte sur la datumoj sen meza prilaborado, kio plibonigas la prilaboradon. De pure teknologia perspektivo, ĝi estas iom simila al Actian Vector, kiu ankaŭ prenas kolonecan vektorigitan OLAP-demandan aliron, kvankam Actian estas dizajnita por preni datenojn prefere ol labori pri procezo aŭ ŝarĝi specifan taskon. »
DuckDB Labs provizas konsilojn kaj subtenon. Kunfondinto kaj CEO Hannes Mühleisen, kiu ankaŭ kunskribis la kodon kaj konservas la projekton, diris, ke li estis inspirita de SQLite, la senservila OLTP datumbaza motoro, kie li vidis ŝancon por simila aliro, sed por analizo.
DuckDB ankaŭ estas ofte uzata kiel parto de analiza aŭ administra stako. pli grandaj datumoj. Ekzemple, se iu konstruas kutiman aplikaĵon, kiu kolektas datumojn kaj poste volas krei SQL-interfacon, li unue devis kopii la datumojn kaj movi ĝin al alia sistemo, kio povus kaŭzi problemojn pri sinkronigado, li klarigis.
Elŝutu kaj akiru
Gravas mencii, ke la hejmpaĝo klare deklaras, ke ĝi ne estu uzata por "grandaj kliento/servilaj instalaĵoj por centralizita entreprena datumstokado".
La projekto laboras pri la eldono de versio 1.0, post kio ne plu eblos fari ŝanĝojn. La verkoj de la akademianoj de la Centro por Matematiko kaj Teoria Komputado Centrum Wiskunde & Informatica en Amsterdamo, DuckDB estas integritaj en gastigan procezon, indas noti, ke ne ekzistas DBMS-servila programaro por instali, ĝisdatigi aŭ konservi.
Ekzemple, la DuckDB Python-pakaĵo povas ruli demandojn rekte sur datumoj de la Python-programa biblioteko, sen importi aŭ kopii datumojn. DuckDB estas skribita en C++, estas senpaga kaj malferma fonto sub la MIT-licenco.
Vi povas lerni pli pri ĝi kaj konsulti la instalan manlibron, En la sekva ligilo.