OpenXLA, פרויקט קוד פתוח להאצת ולפשט למידת מכונה

OpenXLA

OpenXLA היא מערכת אקולוגית של מהדר ML בקוד פתוח בפיתוח משותף

לאחרונה, הוצגו החברות הגדולות העוסקות בפיתוח בתחום למידת מכונה את הפרויקט OpenXLA, מיועד לפיתוח משותף של כלים להרכיב ולייעל מודלים עבור מערכות למידת מכונה.

הפרויקט לקח אחריות על פיתוח כלים המאפשרים לאחד את הקומפילציה של מודלים שהוכנו במסגרות TensorFlow, PyTorch ו-JAX להדרכה וביצוע יעילים על GPUs שונים ומאיצים מיוחדים. חברות כמו גוגל, NVIDIA, AMD, Intel, Meta, Apple, Arm, Alibaba ואמזון הצטרפו לעבודה המשותפת של הפרויקט.

פרויקט OpenXLA מספק מהדר ML מתקדם שיכול להגדיל את הגודל בתוך המורכבות של תשתית ה-ML. עמודי התווך הבסיסיים שלו הם ביצועים, מדרגיות, ניידות, גמישות והרחבה עבור משתמשים. עם OpenXLA, אנו שואפים לפתוח את הפוטנציאל האמיתי של AI על ידי האצת הפיתוח והאספקה ​​שלו.

OpenXLA מאפשרת למפתחים להרכיב ולייעל מודלים מכל מסגרות ה-ML המובילות להדרכה ושירות יעילים במגוון רחב של חומרה. מפתחים המשתמשים ב-OpenXLA יראו שיפורים משמעותיים בזמן ההדרכה, הביצועים, זמן השהיית השירות ובסופו של דבר זמן יציאה לשוק וחישוב עלויות.

יש לקוות כי בהצטרפות מאמצים של צוותי המחקר הראשיים ונציגי הקהילה, ניתן יהיה לעורר את הפיתוח של מערכות למידת מכונה ולפתור את בעיית פיצול התשתיות למסגרות וצוותים שונים.

OpenXLA מאפשר ליישם תמיכה יעילה עבור חומרות שונות, ללא קשר למסגרת שעליה מבוסס מודל למידת המכונה. OpenXLA צפוי להפחית את זמן אימון המודל, לשפר את הביצועים, להפחית את השהייה, להפחית את תקורה המחשוב ולצמצם את זמן היציאה לשוק.

OpenXLA מורכב משלושה מרכיבים עיקריים, שהקוד שלו מופץ תחת רישיון Apache 2.0:

  1. XLA (אלגברה לינארית מואצת) הוא מהדר המאפשר לך לייעל מודלים של למידת מכונה לביצוע ביצועים גבוהים בפלטפורמות חומרה שונות, כולל GPUs, CPUs ומאיצים מיוחדים מיצרנים שונים.
  2. StableHLO הוא מפרט ויישום בסיסיים של קבוצה של פעולות ברמה גבוהה (HLOs) לשימוש במודלים של מערכות למידת מכונה. הוא פועל כשכבה בין מסגרות למידת מכונה ומהדרים שהופכים את המודל לרוץ על חומרה ספציפית. שכבות מוכנות ליצירת מודלים בפורמט StableHLO עבור מסגרות PyTorch, TensorFlow ו-JAX. חבילת MHLO משמשת כבסיס ל-StableHLO, המורחבת עם תמיכה בסריאליזציה ובקרת גרסאות.
  3. IREE (סביבה לביצוע ייצוג ביניים) הוא מהדר וזמן ריצה הממיר מודלים של למידת מכונה לייצוג ביניים אוניברסלי המבוסס על פורמט MLIR (ייצוג רב רמות ביניים) של פרויקט LLVM. מבין המאפיינים, מודגשות האפשרות של קומפילציה מוקדמת (לפני זמן), תמיכה בבקרת זרימה, היכולת להשתמש באלמנטים דינמיים בדגמים, אופטימיזציה למעבדים ו-GPUs שונים ותקורה נמוכה.

לגבי היתרונות העיקריים של OpenXLA, מוזכר כי ביצועים אופטימליים הושגו ללא צורך להתעמק בכתיבת קוד ספציפי למכשיר, בנוסף ל לספק אופטימיזציות מחוץ לקופסה, כולל פישוט של ביטויים אלגבריים, הקצאת זיכרון יעילה, תזמון ביצוע, תוך התחשבות בהפחתת צריכת הזיכרון המקסימלית והתקורות.

יתרון נוסף הוא פישוט קנה המידה והקבלה של חישובים. מספיק שמפתח יוסיף הערות עבור תת-קבוצה של טנזורים קריטיים, שעל בסיסם יכול המהדר ליצור קוד אוטומטי עבור מחשוב מקבילי.

זה גם מודגש ניידות מסופקת עם תמיכה עבור פלטפורמות חומרה מרובות, כגון AMD ו-NVIDIA GPUs, x86 ו-ARM CPUs, Google TPU ML Accelerators, AWS Trainium Inferentia IPUs, Graphcore ו-Wafer-Scale Engine Cerebras.

תמיכה בחיבור הרחבות עם יישום פונקציות נוספות, כתמיכה בכתיבת פרימיטיבים של למידת מכונה עמוקה באמצעות CUDA, HIP, SYCL, Triton ושפות אחרות עבור מחשוב מקביל, כמו גם אפשרות להתאמה ידנית של צווארי בקבוק בדגמים.

לבסוף, אם אתה מעוניין לדעת יותר על כך, תוכל להתייעץ עם פרטים בקישור הבא.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי על הנתונים: AB Internet Networks 2008 SL
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.