4 nyílt forráskódú platform a Big Data számára

Nagy adat

A Big Data egy olyan kifejezés, amely a nagy adatok gyűjtését írja le és ez idővel exponenciálisan növekszik.

Az adatok olyan nagyok és bonyolultabb, mint bármelyik hagyományos adatkezelési eszköz hatékonyan tárolhatja vagy feldolgozhatja őket.

De meg kell értenünk, hogy mindenki A rögzített formátumban tárolható, hozzáférhető és feldolgozható adatokat „strukturált” adatoknak nevezzük.

Hogy nagy léptékben kezelik, amiben megoldásokat kell megvalósítani amelyek rövid idő alatt képesek nagy mennyiségű adat kezelésére, tárolására és elemzésére

Ha nagy számban kezeljük az ábrákat, könnyen megérthetjük, miért adják a „Big Data” nevet és képzelje el a tárolás és feldolgozás kihívásait.

Ezért ma megismerünk néhány népszerű nyílt forráskódú eszközt, amelyek felhasználhatók egy adatelemző platform létrehozására.

Apache Hadoop

hadoop apache

Apache Hadoop az nyílt forráskódú szoftverplatform, amely elosztott környezetben nagyon nagy adatkészleteket dolgoz fel.

Ez az eszköz - a tároláson, a számítási teljesítményen és főleg olcsó alap hardverben.

Apache Hadoop az Úgy tervezték, hogy könnyen méretezhető legyen néhány szerverről ezerre.

Segít a helyileg tárolt adatok általános párhuzamos feldolgozási konfigurációban történő feldolgozásában.

A Hadoop egyik előnye, hogy szoftveres szinten kezeli a hibákat. Az Apache Hadoop keretet biztosít a fájlrendszer réteghez, a fürtkezelő réteghez és a feldolgozási réteghez.

Lehetőséget hagy arra, hogy más projektek és keretek bekerüljenek és működjenek együtt a Hadoop ökoszisztémával, és kialakítsák saját keretrendszerüket a rendszerben elérhető bármely réteg számára.

Elasticsearch

Elasticsearch

Az elasztikus kutatás az egy teljes szöveges kereső és elemző motor. Ez egy rendszer nagymértékben méretezhető és elosztott, kifejezetten megtervezett hatékonyan és gyorsan dolgozni a nagy adatrendszerekkel, ahol az egyik fő felhasználási esete a naplóelemzés.

Képes fejlett és összetett keresésekre, valamint közel valós idejű feldolgozásra a fejlett elemzés és az operatív intelligencia érdekében.

Elasticsearch Java nyelven íródott és Apache Lucene-re épül, Az Elasticsearch egy JSON dokumentumon alapul, sémamentes felépítéssel, ami megkönnyíti és könnyen átvehető.

Ez az egyik vezető üzleti szintű keresőmotor. Bármely programozási nyelvre írhatja az ügyfelet; Az Elasticsearch hivatalosan Java, .NET, PHP, Python, Perl stb.

MongoDB

MongoDB

A MongoDB az a dokumentum adatmodelljén alapuló NoSQL adatbázis. A MongoDB-ben minden gyűjtemény vagy dokumentum.

A MongoDB terminológiájának megértése érdekében a gyűjtemény egy alternatív szó táblához, míg a dokumentum egy alternatív szó a sorokhoz.

MongoDB egy cross-platform, dokumentum-orientált, nyílt forráskódú adatbázis. Főleg C ++ nyelven íródott.

Ez a vezető NoSQL-adatbázis is, amely nagy teljesítményt, magas rendelkezésre állást és könnyű skálázhatóságot kínál.

MongoDB JSON-szerű dokumentumokat használ sémával, és nagyszerű támogatást nyújt a lekérdezésekhez. Néhány fő funkciója az indexelés, a replikáció, a terheléselosztás, az összesítés és a fájlok tárolása.

Cassandra

Cassandra az NoSQL adatbázisok kezelésére tervezett nyílt forráskódú Apache projekt.

Cassandra sorai táblákba vannak rendezve, és egy kulccsal vannak indexelve. Csak mellékletet tartalmazó, rekordalapú tárolómotort használ.

A Cassandra adatait több fő csomóponton osztják szét, egyetlen kudarcpont nélkül. Ez egy magas szintű Apache projekt, amelynek fejlesztését jelenleg az Apache Software Foundation (ASF) felügyeli.

Cassandra az a nagyüzemi működéssel kapcsolatos problémák megoldására (web).

Tekintettel a Cassandra fő architektúrájára, kis (de jelentős) hardverhibák ellenére továbbra is működik. A Cassandra több csomóponton fut több adatközpontban.

Az adatok megismétlése ezekben az adatközpontokban a hibák vagy leállás elkerülése érdekében. Ez rendkívül hibatűrő rendszerré teszi.


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: AB Internet Networks 2008 SL
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   Szent Isid dijo

    Engem inkább a BigData megismerése érdekel, jelenleg van egy fiókom, amelyet az ibm felhőben tárolok, szeretnék ott dolgozni az Apache Sparkkal, de nem sikerült a kapcsolatom a csapattal, nagyra értékelném a támogatását