4 פלטפורמות קוד פתוח לביג דאטה

ביג-דאטה

Big Data הוא מונח המשמש לתיאור איסוף נתונים גדולים וזה צומח באופן אקספוננציאלי עם הזמן.

הנתונים כל כך גדולים ומורכב מכל אחד מכלי ניהול הנתונים המסורתיים אתה יכול לאחסן או לעבד אותם ביעילות.

אבל עלינו להבין שכולם נתונים שניתן לאחסן, לגשת אליהם ולעבד אותם בפורמט קבוע נקראים נתונים 'מובנים'.

כי מנוהלים בהיקפים גדולים, בו יש ליישם פתרונות המסוגלים לטפל, לאחסן ולנתח כמויות גדולות של נתונים בזמן קצר

כאשר מסתכלים על דמויות המטופלות בקנה מידה גדול, אפשר להבין בקלות מדוע ניתן השם 'ביג דאטה' ולדמיין את אתגרי האחסון והעיבוד.

זו הסיבה שהיום אנו הולכים ללמוד על כמה כלים קוד פתוח פופולריים שניתן להשתמש בהם ליצירת פלטפורמת ניתוח נתונים.

אפאצ'י חאופ

hadoop apache

אפאצ'י חדופ הוא פלטפורמת תוכנה קוד פתוח המעבדת מערכי נתונים גדולים מאוד בסביבה מבוזרת.

כלי זה מבוסס על אחסון, כוח חישוב ו- בעיקר בחומרה בסיסית בעלות נמוכה.

אפאצ'י חדופ הוא תוכנן להגדלה בקלות מכמה לאלפי שרתים.

זה עוזר לך לעבד נתונים המאוחסנים מקומית בתצורת עיבוד מקבילה כללית.

אחד היתרונות של Hadoop הוא שהוא מטפל בכישלון ברמת התוכנה. Apache Hadoop מספק מסגרת לשכבת מערכת הקבצים, לשכבת ניהול האשכול ולשכבת העיבוד.

זה מותיר אפשרות לפרויקטים ומסגרות אחרים להיכנס ולעבוד יחד עם המערכת האקולוגית של Hadoop ולפתח מסגרת משלהם לכל אחת מהשכבות הקיימות במערכת.

Elasticsearch

Elasticsearch

חיפוש אלסטיקה הוא מנוע חיפוש וניתוח מבוסס טקסט מלא. זו מערכת מדרגי מאוד ומופץ, תוכנן במיוחד לעבוד ביעילות ובמהירות עם מערכות ביג דאטה, כאשר אחד ממקרי השימוש העיקריים שלו הוא ניתוח יומני.

הוא מסוגל לחיפושים מתקדמים ומורכבים ולעיבוד כמעט אמת בזמן אמת לצורך ניתוח מתקדם ומודיעין מבצעי.

Elasticsearch כתוב בג'אווה ומבוסס על אפאצ'י לוסין, Elasticsearch מבוסס על מסמך JSON עם מבנה נטול סכמות, מה שהופך אותו לקל וקל לאימוץ.

זהו אחד ממנועי החיפוש המובילים בכיתה עסקית. אתה יכול לכתוב את הלקוח שלך בכל שפת תכנות; Elasticsearch עובד רשמית עם Java, .NET, PHP, Python, Perl וכו '.

MongoDB

MongoDB

MongoDB הוא מסד נתונים NoSQL המבוסס על מודל נתוני המסמך. ב- MongoDB הכל אוסף או מסמך.

כדי להבין את המינוח של MongoDB, אוסף הוא מילה חלופית לטבלה, ואילו המסמך הוא מילה חלופית לשורות.

MongoDB הוא מסד נתונים חוצה פלטפורמות עם קוד פתוח, מונחה מסמכים. זה כתוב בעיקר ב- C ++.

זהו גם מסד הנתונים המוביל NoSQL המציע ביצועים גבוהים, זמינות גבוהה, ומדרגיות קלה.

MongoDB משתמש במסמכים דמויי JSON עם סכמה ומספק תמיכה רבה בשאילתות. חלק מתפקידיה העיקריים כוללים אינדקס, שכפול, איזון עומסים, צבירה ואחסון קבצים.

קסנדרה

קסנדרה היא פרויקט אפאצ'י קוד פתוח המיועד לניהול מסדי נתונים NoSQL.

השורות של קסנדרה מסודרות בטבלאות ובאינדקס באמצעות מפתח. הוא משתמש במנוע אחסון מבוסס תקליטים בלבד.

הנתונים בקסנדרה מופצים על פני מספר צמתים ראשיים, בלי נקודת כישלון אחת. זהו פרויקט אפאצ'י ברמה גבוהה, ועל פיתוחו מפקחת כעת קרן אפאצ'י תוכנה (ASF).

קסנדרה היא נועד לפתור בעיות הקשורות לפעולה בקנה מידה גדול (רשת).

בהתחשב בארכיטקטורת האב של קסנדרה, היא יכולה להמשיך לפעול למרות מספר קטן (אך משמעותי) של כשלים בחומרה. קסנדרה פועלת על מספר צמתים במספר מרכזי נתונים.

העתק נתונים במרכזי נתונים אלה כדי למנוע כשלים או השבתה. זה הופך אותה למערכת סובלנית מאוד לתקלות.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי על הנתונים: AB Internet Networks 2008 SL
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   סנט איזיד דיג'ו

    אני מעוניין יותר ללמוד על BigData, כרגע יש לי חשבון שמתארח בענן ibm, הייתי רוצה לעבוד שם עם Apache Spark אבל לא הצלחתי לקשר טוב עם הצוות שלי, אודה לתמיכתך