4 платформе отвореног кода за велике податке

Велики података

Велики подаци су израз који се користи за описивање прикупљања великих података а то временом експоненцијално расте.

Подаци су тако велики и сложени од било ког традиционалног алата за управљање подацима можете их ефикасно чувати или обрађивати.

Али морамо схватити да сви подаци који се могу чувати, приступити им и обрађивати у фиксном формату називају се „структурирани“ подаци.

Да управљају се у великим размерама, у којима решења се морају применити који су у могућности да обрађују, чувају и анализирају велике количине података у кратком времену

Када се гледају бројке којима се рукује у великој мери, лако се може разумети зашто је дато име „велики подаци“ и замислите изазове складиштења и обраде.

Због тога ћемо данас научити неке популарне алате отвореног кода који се могу користити за стварање платформе за анализу података.

Апацхе Хадооп

хадооп-апацхе

Апацхе Хадооп је софтверска платформа отвореног кода која обрађује веома велике скупове података у дистрибуираном окружењу.

Овај алат заснива се на складишту, рачунарској снази и углавном у јефтином основном хардверу.

Апацхе Хадооп је дизајниран за лако скалирање са неколико на хиљаде сервера.

Помаже вам да обрађујете локално ускладиштене податке у општој конфигурацији паралелне обраде.

Једна од благодати Хадооп-а је та што рјешава кварове на софтверском нивоу. Апацхе Хадооп пружа оквир за слој система датотека, слој управљања кластером и слој обраде.

Оставља могућност за друге пројекте и оквире да уђу и раде заједно са Хадооп екосистемом и развију сопствени оквир за било који слој доступан у систему.

Еластицсеарцх

Еластицсеарцх

Еластицсеарцх је претраживач и аналитика заснован на пуном тексту. То је систем високо скалабилан и дистрибуиран, посебно дизајниран да ефикасно и брзо раде са системима великих података, где је један од главних случајева употребе анализа дневника.

Способан је за напредне и сложене претраге и обраду у скоро реалном времену за напредну анализу и оперативну интелигенцију.

Еластицсеарцх је написан на Јави и заснован је на Апацхе Луцене, Еластицсеарцх заснован је на ЈСОН документу са структуром без шеме, што га чини лаким и лаким за усвајање.

То је један од водећих претраживача пословног нивоа. Можете писати свог клијента на било којем програмском језику; Еластицсеарцх званично ради са Јава, .НЕТ, ПХП, Питхон, Перл итд.

МонгоДБ

МонгоДБ

МонгоДБ је база података НоСКЛ заснована на моделу података документа. У МонгоДБ-у је све збирка или документ.

Да бисмо разумели МонгоДБ терминологију, збирка је алтернативна реч за табелу, док је документ алтернативна реч за редове.

МонгоДБ је база података са више платформи, оријентисана на документе отвореног кода. Написан је углавном на језику Ц ++.

Такође је водећа НоСКЛ база података која нуди високе перформансе, високу доступност и лаку скалабилност.

МонгоДБ користи ЈСОН-сличне документе са шемом и пружа велику подршку за упите. Неке од његових главних функција укључују индексирање, репликацију, уравнотежење оптерећења, агрегацију и складиштење датотека.

Касандра

Касандра је пројекат отвореног кода Апацхе дизајниран за администрацију базе података НоСКЛ.

Касандрини редови су организовани у табеле и индексирани кључем. Користи додатак, механизам за складиштење заснован на записима.

Подаци у Цассандри дистрибуирају се кроз више главних чворова, без иједне тачке неуспеха. То је Апацхе пројекат на високом нивоу, а његов развој тренутно надгледа Апацхе Софтваре Фоундатион (АСФ).

Касандра је дизајниран за решавање проблема повезаних са великим радом (веб).

С обзиром на главну архитектуру Цассандре, она може да настави да ради упркос малом (али значајном) броју хардверских кварова. Цассандра ради на више чворова у више центара података.

Копирајте податке у овим центрима података да бисте избегли кварове или застоје. То га чини системом отпорним на кварове.


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. Odgovorni za podatke: AB Internet Networks 2008 SL
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.

  1.   Сант Исид дијо

    Тренутно ме више занима сазнање о БигДата-и. Тренутно имам налог хостован у ибм цлоуд-у, желео бих да радим тамо са Апацхе Спарк-ом, али нисам успео да се добро повежем са својим тимом, ценио бих вашу подршку