המערה של ChatGPT

הם אומרים שלחידושים הקלאסיקה. אלגוריה שנכתבה ארבע מאות שנים מהתקופה שלנו היא אידיאלית כדי להבין מה הם הגבולות של היישומים החדשים של בינה מלאכותית. אני מתכוון ל"מערת ChatGPT" שהיא לא יותר ולא פחות מעיבוד של האלגוריה המפורסמת של מערת אפלטון

אין לי התנגדות לשימוש בכלי בינה מלאכותית. למעשה, אני מוצא שהם עושים את העבודה הרבה יותר קלה. אבל כל עוד לשמש אנשים שיש להם מספיק ידע כדי להעריך את עבודתך.

לדוגמה; אפשר לבקש מ-ChatGPT לכתוב תוסף וורדפרס, אבל אם חסר לך ידע ב-PHP תוסף זה עלול לגרום לבעיות אבטחה רציניות.

האלגוריה של המערה

אפלטון היה פילוסוף יווני שחי בין המאות ה-XNUMX ל-XNUMX לפני הספירה. הוא הביע את מחשבותיו בצורה של מיתוסים ואלגוריות. הידוע שבהם היה זה של המערה.

פורסם ב לה רפובליקה, מדמיינת האלגוריה קבוצת אנשים כבולים במערה, מאחוריהם יש אש שמטילה צללים על הקיר שלפניהם. הצללים הם הדבר היחיד שהם רואים ומדמיינים שהם הדבר היחיד שקיים, תוך התעלמות ממה שמעבר.

כשאחד האסירים משתחרר, הוא מסוגל לראות את העולם כפי שהוא באמת ומבין עד כמה היו חוויותיו במערה מוגבלות.

לפי חוקרי אפלטון, אלגוריה זו מדגישה שכולנו חיים את חיינו על סמך המידע והחוויות שלנו. מידע וחוויות שוות ערך לצללי המערה. בדיוק כמו האסירים, יש את המציאות האמיתית והיא מעבר להבנתנו.

המערה של ChatGPT

ל-ChatGPT ולמתחרים שלה יש גם מעריצים וגם מתנגדים. אבל אף אחד לא נתן הסבר טכני על הכשלים שלו עד לכתבה פורסם בניו יורקר מאת סופר המדע הבדיוני טד צ'אנג

כדי להסביר את הפגמים במודלים של שפה, צ'אנג עושה אנלוגיה למה שקורה עם תמונות וקבצי אודיו.

ההקלטה והשכפול של קובץ דיגיטלי דורשים שני שלבים: הראשון הוא קידוד, בשלב זה הקובץ מומר לפורמט קומפקטי יותר, ואחריו פענוח, שהוא תהליך הפוך. תהליך ההמרה נקרא lossless (הקובץ המשוחזר זהה למקור) או אובדן (חלק מהמידע אובד לנצח). דחיסה אובדנית מוחלת על קבצי תמונה, וידאו או אודיו ולרוב אינה מורגשת. כשזה כן, זה נקרא חפץ דחיסה. חפצי דחיסה מופיעים בצורה של טשטוש בתמונות או צלצול באודיו.

צ'אנג משתמש באנלוגיה של JPG מעורפל מהאינטרנט כדי להתייחס למודלים של שפות. וכן, זה די מדויק. שניהם דוחסים את המידע תוך שמירה רק על "הדבר החשוב". למודלים של שפה יוצרים, מתוך כמויות גדולות של נתוני טקסט, ייצוג קומפקטי של התבניות והיחסים בין מילים וביטויים.

מתוכו נוצר טקסט חדש שמנסה ככל האפשר להפוך אותו לדומה בתוכן ובמשמעות לטקסט המקורי. הבעיה היא כאשר אין מספיק מידע באינטרנט כדי ליצור טקסט חדש. זה מתורגם ל-ChatGPT להיות מסוגל לכתוב מאמר ברמת מכללה, אבל לא לבצע פעולות פשוטות של 5 ספרות.

צ'אנג מסכם כי:

גם אם אפשר להגביל מודלים של שפות גדולות מהשתתפות בכתיבה, האם עלינו להשתמש בהם ליצירת תוכן אינטרנט? זה יהיה הגיוני רק אם המטרה שלנו היא לארוז מחדש מידע שכבר זמין באינטרנט. יש חברות שקיימות כדי לעשות בדיוק את זה; אנחנו בדרך כלל קוראים להם מפעלי תוכן. אולי הטשטוש של דגמי השפה מועיל להם, כדרך להימנע מהפרת זכויות יוצרים. אם כי באופן כללי, הייתי אומר שכל מה שטוב למפעלי תוכן אינו טוב לאנשים שמחפשים מידע. העלייה של סוג זה של אריזה מחדש היא מה שמקשה עלינו למצוא את מה שאנחנו מחפשים באינטרנט כרגע.; ככל שיותר טקסט שנוצר על ידי מודלים של שפות גדולות מתפרסם ברשת, כך הרשת הופכת לגרסה מטושטשת יותר של עצמה.

וכמו האסירים במערה, הניסיון שלנו יהיה הרבה יותר קטן ממה שהמציאות מציעה לנו.

השאירו את התגובה שלכם בטל תשובה

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

תגובה *

שם*

דואר אלקטרוני*

אני מקבל את תנאי פרטיות*

אחראי על הנתונים: AB Internet Networks 2008 SL
מטרת הנתונים: בקרת ספאם, ניהול תגובות.
לגיטימציה: הסכמתך
מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

אני רוצה לקבל את העלון