בינה מלאכותית כוללת תחומים שונים, רבים מהם דורשים לכידה או פרשנות של אותות מחו"ל. בפוסט זה נראה כלי קוד פתוח לראייה ממוחשבת.
זה אחד מהתחומים הרבים לאן מובילה תוכנת קוד פתוח וחינמית ביצועים טובים יותר על חלופות קנייניות.
מהי ראיית מחשב?
מחשבים הצליחו לצלם תמונות כבר זמן רב, אבל לגרום לו להכיר ולהגיב אליהם זה תחום שהמריא בשנים האחרונות. העניין בסוג זה של יכולת צמח מהמאמצים לשפר את טכנולוגיות זיהוי הפנים והמירוץ לפיתוח הרכב הראשון ללא נהג.
האתגר הוא ליצור אלגוריתמים שמסוגלים לזהות צורות, צבעים ותבניות בתמונות שצולמו על ידי מחשבים., כמו גם לזהות תנועה, לעקוב אחר דברים ולהבין את מיקומם המרחבי. הכלים החזקים ביותר משתמשים באלגוריתמי למידה עמוקה שהוכשרו על מיליוני תמונות ידועות שיאפשרו לך לזהות דפוסים ולבצע תחזיות בעתיד.
בנוסף לרכבים אוטונומיים, ישנם שימושים אפשריים נוספים כמו ניתוח תמונות רפואיות או איתור פגמים במוצרים מיוצרים שאינם נראים לעין האדם.
אלגוריתם למידה עמוקה שונה מאלגוריתמי למידה מסורתיים בכך שהיא מבוססת על רשת עצבית רב-שכבתית המסוגלת ללמוד על ידי חילוץ מידע רלוונטי מנתוני הקלט בעצמה.
כלי קוד פתוח לראייה ממוחשבת
ספריית ראייה ממוחשבת היא קבוצה של תוכניות כתובות מראש שיכולות לשמש את המפתחים יישומים הדורשים יכולות עיבוד תמונה ווידאו. שימוש בספריות אלו מאפשר לך להפחית את זמן הקידוד.
OpenCV
Es הפופולרי ביותר מבין חנויות הספרים ברשימה זו. יש לו גרסאות לשפות התכנות Python, Java, C++ ו-Javascript בין היתר. זה יכול להיכלל ביישומים עבור Windows, Mac ו-Android.
חלק מהשימושים של OpenCV הם זיהוי פנים, זיהוי תנועה, זיהוי מחוות וזיהוי אובייקטים.
SimpleCV
זה בערך של קבוצה של תוכנות וספריות שפותחו ב-Python אידיאליות עבור יישומי אב טיפוס התואמים למצלמות אינטרנט, IP ומכשירים ניידים שונים.
זה לא דורש למידה כמו האפשרויות האחרות.
deepface
קומו שמו מציין את זה, זה כלי לעבודה עם פרצופים. זוהי ספרייה עבור Python המאפשרת לנתח פרצופים בזמן אמת, לזהות אותם, לבצע אימותים ולנתח את התכונות שלהם.
BoofCV
תוכנה זו הוא כתוב מאפס ומתמקד בעיבוד תמונה ברמה נמוכה, כיול מצלמה, זיהוי/מעקב אחר תכונות, דפוסי תנועה וזיהוי. כל זה בזמן אמת.
OpenWINE
שֵׁם של ספרייה זו מגיע מהראשי תיבות של Open Visual Inference ו- Neural Network Optimization. הוא מורכב מסט של כלים לאופטימיזציה של יישומים המחקים את הראייה האנושית. השימוש בו מחייב מודל מאומן מראש. השימוש בו מיועד לזיהוי עצמים, זיהוי פנים ותנועה וצביעה.
אלבומים
Es ספריית Python המשמשת לסיווג תמונות, הערכת תנוחות וזיהוי אובייקטים.
Caffe
מעניין איך ראשי התיבות של בינה מלאכותית מתייחסים לאוכל, יין, קפה. במקרה האחרון זה אומר ארכיטקטורה Convolutional for Fast Feature Embedding. הוא כתוב ב-C++, אם כי יש לו תמיכה במספר שפות וארכיטקטורות למידה עמוקה שונות. הוא אידיאלי לסיווג ופילוח תמונות מה שהופך אותו לאידיאלי עבור פרויקטי מחקר אקדמיים, אבות טיפוס של מוצרים ויישומים תעשייתיים בקנה מידה גדול הדורשים יכולות ראייה, קול ומולטימדיה.
ניכר כי יש עוד הרבה מה לעשות בתחום הבינה המלאכותית. אבל, קיומן של ספריות קוד פתוח נותן לנו תקווה שהפתרונות שמפותחים אינם נשלטים על ידי מעטים.