તેઓ કહે છે કે નવીનતાઓ માટે ક્લાસિક. આર્ટિફિશિયલ ઇન્ટેલિજન્સની નવી એપ્લિકેશનની મર્યાદાઓ શું છે તે સમજવા માટે આપણા યુગની ચાર સદીઓ પર લખાયેલ રૂપક આદર્શ છે. હું "ચેટજીપીટી ગુફા" નો ઉલ્લેખ કરી રહ્યો છું જે પ્લેટોની ગુફાના પ્રખ્યાત રૂપકના અનુકૂલન કરતાં વધુ કે ઓછી નથી.
મને આર્ટિફિશિયલ ઈન્ટેલિજન્સ ટૂલ્સના ઉપયોગ સામે કોઈ વાંધો નથી. હકીકતમાં, મને લાગે છે કે તેઓ કામને વધુ સરળ બનાવે છે. પરંતુ જ્યાં સુધી તમારા કાર્યનું મૂલ્યાંકન કરવા માટે પૂરતી જાણકારી ધરાવતા લોકો દ્વારા ઉપયોગમાં લેવાશે.
દાખ્લા તરીકે; કોઈ ChatGPT ને WordPress પ્લગઈન લખવા માટે કહી શકે છે, પરંતુ જો કોઈને PHP નું જ્ઞાન ન હોય તો તે પ્લગઈન ગંભીર સુરક્ષા સમસ્યાઓનું કારણ બની શકે છે.
ગુફાની રૂપક
પ્લેટો એક ગ્રીક ફિલસૂફ હતા જે પૂર્વે XNUMXમી અને XNUMXથી સદી વચ્ચે રહેતા હતા. તેણે પોતાના વિચારો દંતકથાઓ અને રૂપકના રૂપમાં વ્યક્ત કર્યા. તેમાંથી સૌથી વધુ જાણીતી ગુફા હતી.
માં પોસ્ટ કર્યું લા રેપબ્લિકા, રૂપક કલ્પના કરે છે ગુફામાં બંધાયેલા લોકોનું જૂથ, તેમની પાછળ તેમની પાસે આગ છે જે તેમની સામે દિવાલ પર પડછાયાઓ પાડે છે. પડછાયાઓ એ એકમાત્ર વસ્તુ છે જે તેઓ જુએ છે અને કલ્પના કરે છે કે તે એકમાત્ર વસ્તુ છે જે અસ્તિત્વમાં છે, જે બહાર છે તેની અવગણના કરે છે.
જ્યારે કેદીઓમાંના એકને મુક્ત કરવામાં આવે છે, ત્યારે તે ખરેખર શું છે તે માટે વિશ્વને જોવા માટે સક્ષમ છે અને સમજે છે કે ગુફામાં તેના અનુભવો કેટલા મર્યાદિત હતા.
પ્લેટોના વિદ્વાનોના મતે, આ રૂપક દર્શાવે છે કે આપણે બધા આપણી પોતાની માહિતી અને અનુભવોના આધારે આપણું જીવન જીવીએ છીએ. ગુફાના પડછાયા સમાન માહિતી અને અનુભવો. કેદીઓની જેમ જ સાચી વાસ્તવિકતા છે અને તે આપણી સમજની બહાર છે.
ChatGPT ની ગુફા
ChatGPT અને તેના સ્પર્ધકોના બંને પ્રશંસકો છે અને વિરોધીઓ પરંતુ, એક લેખ સુધી તેની નિષ્ફળતાઓ વિશે કોઈએ તકનીકી સમજૂતી આપી ન હતી પ્રકાશિત વિજ્ઞાન સાહિત્ય લેખક ટેડ ચાંગ દ્વારા ન્યૂ યોર્કરમાં
ભાષાના મોડલની ખામીઓને સમજાવવા માટે, ચાંગ ઈમેજો અને ઓડિયો ફાઈલો સાથે શું થાય છે તેની સાથે સાદ્રશ્ય બનાવે છે.
ડિજિટલ ફાઇલના રેકોર્ડિંગ અને પ્રજનન માટે બે પગલાંની જરૂર છે: પ્રથમ છે એન્કોડિંગ, જે સમયે ફાઇલને વધુ કોમ્પેક્ટ ફોર્મેટમાં રૂપાંતરિત કરવામાં આવે છે, ત્યારબાદ ડીકોડિંગ થાય છે, જે વિપરીત પ્રક્રિયા છે. રૂપાંતર પ્રક્રિયાને લોસલેસ (પુનઃસ્થાપિત ફાઇલ મૂળ જેવી જ છે) અથવા નુકસાનકારક (કેટલીક માહિતી કાયમ માટે ખોવાઈ ગઈ છે) કહેવાય છે. ઇમેજ, વિડિયો અથવા ઑડિઓ ફાઇલો પર નુકસાનકારક કમ્પ્રેશન લાગુ કરવામાં આવે છે અને તે મોટાભાગે ધ્યાનપાત્ર નથી. જ્યારે તે હોય, ત્યારે તેને કમ્પ્રેશન આર્ટિફેક્ટ કહેવામાં આવે છે. કમ્પ્રેશન આર્ટિફેક્ટ્સ ઈમેજોમાં અસ્પષ્ટતા અથવા ઑડિયોમાં ક્લૅન્કિંગના સ્વરૂપમાં દેખાય છે.
ચાંગ ભાષાના મોડલનો સંદર્ભ આપવા માટે વેબ પરથી અસ્પષ્ટ JPG ની સામ્યતાનો ઉપયોગ કરે છે. અને, આ એકદમ સચોટ છે. બંને માહિતીને માત્ર "મહત્વની વસ્તુ" રાખીને સંકુચિત કરે છે. એલભાષા મૉડલ્સ, મોટા પ્રમાણમાં ટેક્સ્ટ ડેટામાંથી, પેટર્ન અને શબ્દો અને શબ્દસમૂહો વચ્ચેના સંબંધોનું સંક્ષિપ્ત પ્રતિનિધિત્વ બનાવે છે.
તેમાંથી, એક નવું લખાણ મૂળ લખાણની સામગ્રી અને અર્થમાં સમાન બનાવવા માટે શક્ય તેટલું પ્રયાસ કરીને જનરેટ કરવામાં આવે છે. સમસ્યા ત્યારે થાય છે જ્યારે નવું લખાણ જનરેટ કરવા માટે વેબ પર પૂરતી માહિતી ન હોય. આ ChatGPT કૉલેજ સ્તરનો નિબંધ લખવામાં સક્ષમ હોવાનો અનુવાદ કરે છે, પરંતુ સરળ 5-અંકની કામગીરી કરી શકતું નથી.
ચાંગ તારણ આપે છે કે:
મોટા ભાષાના મોડલને ઓથરિંગમાં ભાગ લેવાથી પ્રતિબંધિત કરવાનું શક્ય હોય તો પણ, શું આપણે તેનો ઉપયોગ વેબ સામગ્રી જનરેટ કરવા માટે કરવો જોઈએ? જો અમારો ધ્યેય વેબ પર પહેલેથી જ ઉપલબ્ધ માહિતીને પુનઃપેકેજ કરવાનો હોય તો જ આનો અર્થ થશે. કેટલીક કંપનીઓ તે કરવા માટે અસ્તિત્વ ધરાવે છે; અમે તેમને સામાન્ય રીતે સામગ્રી ફેક્ટરીઓ કહીએ છીએ. કદાચ કોપીરાઈટના ઉલ્લંઘનને ટાળવાના માર્ગ તરીકે ભાષાના નમૂનાઓની અસ્પષ્ટતા તેમના માટે ઉપયોગી છે. સામાન્ય રીતે કહીએ તો, હું કહીશ કે સામગ્રી ફેક્ટરીઓ માટે જે કંઈ સારું છે તે માહિતી શોધી રહેલા લોકો માટે સારું નથી. આ પ્રકારના રિપેકેજિંગનો ઉદય એ છે જે આપણે અત્યારે ઓનલાઈન જે શોધી રહ્યા છીએ તે શોધવાનું અમારા માટે મુશ્કેલ બની રહ્યું છે.; મોટા ભાષાના મોડેલો દ્વારા જનરેટ થયેલો વધુ ટેક્સ્ટ વેબ પર પ્રકાશિત થાય છે, તેટલું જ વેબ પોતાનું એક અસ્પષ્ટ સંસ્કરણ બની જાય છે.
અને, ગુફામાંના કેદીઓની જેમ, વાસ્તવિકતા આપણને જે આપે છે તેના કરતાં આપણો અનુભવ ઘણો નાનો હશે.