ChatGPT च्या गुहा

ChatGPT वर जास्त विश्वास ठेवल्याने समस्या येऊ शकतात

ते म्हणतात की नॉव्हेल्टीसाठी क्लासिक्स. आर्टिफिशियल इंटेलिजन्सच्या नवीन ऍप्लिकेशन्सच्या मर्यादा काय आहेत हे समजून घेण्यासाठी आपल्या काळातील चार शतके लिहिलेले रूपक आदर्श आहे. मी "चॅटजीपीटी गुहा" चा संदर्भ देत आहे जी प्लेटोच्या गुहेच्या प्रसिद्ध रूपकांच्या रूपांतरापेक्षा जास्त किंवा कमी नाही.

आर्टिफिशियल इंटेलिजन्स टूल्सच्या वापरावर माझा आक्षेप नाही. खरं तर, मला वाटते की ते काम खूप सोपे करतात. पण जोपर्यंत तुमच्या कामाचे मूल्यमापन करण्यासाठी पुरेसे ज्ञान असलेल्या लोकांद्वारे वापरले जावे.

उदाहरणार्थ; एखादी व्यक्ती ChatGPT ला वर्डप्रेस प्लगइन लिहिण्यास सांगू शकते, परंतु जर एखाद्याला PHP चे ज्ञान नसेल तर त्या प्लगइनमुळे गंभीर सुरक्षा समस्या उद्भवू शकतात.

गुहेचे रूपक

प्लेटो हा एक ग्रीक तत्ववेत्ता होता जो इसवी सनपूर्व ५व्या ते चौथ्या शतकादरम्यान जगला होता. पुराणकथा आणि रूपकांच्या रूपात त्यांनी आपले विचार व्यक्त केले. त्यांपैकी सर्वांत जास्त ओळखली जाणारी गुहा होती.

पोस्ट केलेले ला रिपब्लिका, रूपक कल्पना करते गुहेत साखळदंडाने बांधलेल्या लोकांचा समूह, त्यांच्या मागे एक आग आहे जी त्यांच्या समोर भिंतीवर सावल्या पाडते. सावल्या ही एकमेव गोष्ट आहे जी ते पाहतात आणि कल्पना करतात की ते अस्तित्वात असलेली एकमेव गोष्ट आहे, पलीकडे असलेल्या गोष्टींकडे दुर्लक्ष करून.

जेव्हा कैद्यांपैकी एकाची सुटका केली जाते, तेव्हा तो खरोखर काय आहे हे जग पाहू शकतो आणि गुहेतील त्याचे अनुभव किती मर्यादित होते याची जाणीव होते.

प्लेटोच्या विद्वानांच्या मते, हे रूपक हायलाइट करते की आपण सर्वजण आपल्या स्वतःच्या माहिती आणि अनुभवांवर आधारित आपले जीवन जगतो. गुहेच्या सावल्यांच्या बरोबरीची माहिती आणि अनुभव. कैद्यांप्रमाणेच खरे वास्तव आहे आणि ते आपल्या आकलनाच्या पलीकडे आहे.

ChatGPT च्या गुहा

ChatGPT आणि त्याच्या प्रतिस्पर्ध्यांचे दोन्ही प्रशंसक आहेत आणि विरोधक पण, लेख येईपर्यंत त्याच्या अपयशाबद्दल कोणीही तांत्रिक स्पष्टीकरण दिले नव्हते प्रकाशित न्यू यॉर्करमध्ये विज्ञान कथा लेखक टेड चांग यांचे

भाषा मॉडेलमधील त्रुटी स्पष्ट करण्यासाठी, चँग प्रतिमा आणि ऑडिओ फायलींसह काय होते याच्याशी साधर्म्य बनवतात.

डिजिटल फाइलचे रेकॉर्डिंग आणि पुनरुत्पादन करण्यासाठी दोन चरणांची आवश्यकता आहे: पहिली आहे एन्कोडिंग, ज्या ठिकाणी फाइल अधिक कॉम्पॅक्ट फॉरमॅटमध्ये रूपांतरित केली जाते, त्यानंतर डीकोडिंग होते, जी उलट प्रक्रिया आहे. रूपांतरण प्रक्रियेला लॉसलेस (पुनर्संचयित केलेली फाइल मूळ सारखीच असते) किंवा तोटा (काही माहिती कायमची हरवलेली असते) असे म्हणतात. प्रतिमा, व्हिडिओ किंवा ऑडिओ फाइल्सवर हानीकारक कॉम्प्रेशन लागू केले जाते आणि बहुतेक वेळा लक्षात येत नाही. जेव्हा ते असते तेव्हा त्याला कॉम्प्रेशन आर्टिफॅक्ट म्हणतात. कॉम्प्रेशन आर्टिफॅक्ट्स प्रतिमांमध्ये अस्पष्ट किंवा ऑडिओमध्ये क्लॅंकिंगच्या स्वरूपात दिसतात.

भाषेच्या मॉडेल्सचा संदर्भ देण्यासाठी चांग वेबवरील अस्पष्ट JPG चे सादृश्य वापरतो. आणि, हे अगदी अचूक आहे. दोघेही फक्त "महत्त्वाची गोष्ट" ठेवून माहिती संकुचित करतात. एलभाषा मॉडेल मोठ्या प्रमाणात मजकूर डेटामधून, नमुने आणि शब्द आणि वाक्यांशांमधील संबंधांचे संक्षिप्त प्रतिनिधित्व तयार करतात.

त्यातून, एक नवीन मजकूर तयार केला जातो आणि शक्यतो तो मूळ मजकुराप्रमाणे आशय आणि अर्थाप्रमाणे बनवण्याचा प्रयत्न केला जातो. नवीन मजकूर तयार करण्यासाठी वेबवर पुरेशी माहिती नसताना समस्या उद्भवते. हे ChatGPT ला महाविद्यालय स्तरावरील निबंध लिहिण्यास सक्षम आहे, परंतु साधी 5-अंकी ऑपरेशन्स करत नाही.

चांग असा निष्कर्ष काढतो की:

मोठ्या भाषेच्या मॉडेल्सना ऑथरिंगमध्ये सहभागी होण्यापासून प्रतिबंधित करणे शक्य असले तरीही, आम्ही त्यांचा वापर वेब सामग्री तयार करण्यासाठी केला पाहिजे का? वेबवर आधीपासून उपलब्ध असलेली माहिती पुन्हा पॅक करणे हे आमचे ध्येय असेल तरच याचा अर्थ होईल. काही कंपन्या फक्त ते करण्यासाठी अस्तित्वात आहेत; आम्ही त्यांना सामान्यतः सामग्री कारखाने म्हणतो. कॉपीराइट उल्लंघन टाळण्याचा एक मार्ग म्हणून कदाचित भाषा मॉडेल्सची अस्पष्टता त्यांच्यासाठी उपयुक्त आहे. सर्वसाधारणपणे सांगायचे तर, मी असे म्हणेन की सामग्री कारखान्यांसाठी जे काही चांगले आहे ते माहिती शोधत असलेल्या लोकांसाठी चांगले नाही. या प्रकारच्या रीपॅकेजिंगच्या वाढीमुळे आम्ही सध्या ऑनलाइन जे शोधत आहोत ते शोधणे आमच्यासाठी कठीण होत आहे.; मोठ्या भाषेच्या मॉडेल्सद्वारे व्युत्पन्न केलेला अधिक मजकूर वेबवर प्रकाशित केला जातो, तितकी वेब स्वतःची अस्पष्ट आवृत्ती बनते.

आणि, गुहेतील कैद्यांप्रमाणे, वास्तविकता आपल्याला जे काही देते त्यापेक्षा आपला अनुभव खूपच लहान असेल.


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटासाठी जबाबदार: AB इंटरनेट नेटवर्क 2008 SL
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.