Maatriksite ja teadusandmete säilitamiseks mõeldud andmebaas TileDB 2.0

Hiljuti teatati TileDB 2.0 uue versiooni väljaandmisest, milles integreerimine lisandub tööle erinevate pilveteenustega, võime kasutada erinevaid algoritme, erinevate salvestusmootorite täiustused ja muu.

Neile, kellele TileDB pole tuttav, peaksid nad seda teadma on andmebaas, mis on loodud andmeteaduse meeskondade abistamiseks teha avastusi kiiremini, pakkudes neile võimsamat viisi suurte mitmekesiste andmete kogumite salvestamiseks, värskendamiseks, analüüsimiseks ja jagamiseks.

TileDB kohta

TileDB koosneb uuest mitmemõõtmelise massiivi andmevormingust, kiire, manustatav, avatud lähtekoodiga C ++ salvestusmootor koos andmeteaduste tööriistade integreerimise ja pilveteenusega hõlpsaks serverivaba arvutamise ja andmete haldamise jaoks.

PlaatDB on optimeeritud maatriksite ja mitmemõõtmeliste teaduslike arvutuste jaoks kasutatud andmete salvestamiseksnagu näiteks erinevad süsteemid geneetilise teabe, ruumi- ja finantsandmete töötlemiseks, see tähendab süsteemid, mis töötavad hajutatud või pidevalt täidetud mitmemõõtmeliste maatriksitega.

TileDB pakub eraldiseisvat ja sisseehitatud C ++ teeki mis tarnitakse API-ga C, C ++, Python, R, Java ja Go ja teil on otsene juurdepääs massiividele TileDB.

Raamatukogu on integreeritud Sparki, Daski, PrestoDB, MariaDB, Arrow ja georuumiliste teekidega, nagu PDAL, GDAL ja Rasterio. TileDB lükkab võimalikult palju arvutusi salvestusruuminagu näiteks SQL-i mootori filtri tingimused ja Dask and Sparki andmeraami arvutused.

Andmebaasi kõrval on TileDB Cloud - tasuline teenus, mida saate kasutada pilves TileDB massiivide jagamiseks teiste kasutajatega ja nende serverita arvutuste tegemiseks.

TileDB peamistest omadustest silma paistavad järgmised:

  • Tõhusad meetodid hõredate massiivide säilitamiseks, mille andmeid ei järgita pidevalt, massiiv on täidetud tükkidega ja enamik elemente jäävad tühjaks või võtavad sama väärtuse.
  • Võimalus pääseda juurde andmetele võtmeväärtuse vormingus või veergude komplektides (DataFrame);
  • AWS S3, Google Cloud Storage ja Azure Blob Storage integreerimise tugi.
  • TileDB toetab tõhusalt andmete vormindamist, mis on selle vormingusse ja salvestusmootorisse sisseehitatud.
  • Sellel on mitmesuguseid optimeerimisi paralleelse I / O ümber pilveobjektide poodides ja mitmekeermelisi arvutusi (näiteks klassifitseerimine, tihendamine jne).
  • Võimalus kasutada erinevaid andmete tihendamise ja krüpteerimise algoritme.
  • Kontrollsumma terviklikkuse tugi.
  • See töötab mitmikeermelises režiimis koos sisendi / väljundi paralleelsusega.
  • Toetus salvestatud andmete versioonimisele, isegi oleku toomisele teatud minevikus või suurte täisarvude aatomilisele värskendamisele.
  • Võimalus linkida metaandmeid.
  • Andmete rühmitamise tugi.
  • Integreerimismoodulid, mida kasutatakse madala salvestusmootorina Sparkis, Daskis, MariaDB-s, GDAL-is, PDAL-is, Rasterios, gVCF-is ja PrestoDB-s.
  • C ++ API sidumisraamatukogud Pythoni, R, Java ja Go keeltele.

Projekti kood on kirjutatud C ++ keeles ja levitatud MIT-litsentsi alusel ning ühildub Linuxi, macOS-i ja Windowsiga.

Teave versiooni 2.0 kohta

Versioon 2.0 paistab silma ühilduvusega «DataFrame» kontseptsiooniga, et võimaldab salvestada andmeid väärtuste veergude kujul meelevaldne pikkus, seotud konkreetsete atribuutidega ja et R-i ümber kujundatud API

Salvestus on optimeeritud ka hõredate maatriksite töötlemiseks suuruse poolest heterogeenne (lahtritesse saab salvestada erinevat tüüpi andmeid ja on võimalik ühendada näiteks erinevat tüüpi veerge, kuhu on salvestatud nimi, aeg ja hind).

Lisatud stringiandmetega veergude tugi moodulid lisati integreerimiseks Google Cloud Storage ja Azure Blob Storage. 

Lõpuks, kui soovite selle uue versiooni kohta rohkem teada saada, lkVäljalaskemärkmega saate tutvuda aadressil järgmine link.

Y selle installimise kohta lisateabe saamiseks juurutamist ja dokumentatsiooni, saate seda teha järgmine link.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.