ถ้ำของ ChatGPT

พวกเขาบอกว่าคลาสสิกสำหรับความแปลกใหม่ การเปรียบเทียบที่เขียนขึ้นสี่ศตวรรษในยุคของเราเหมาะที่จะทำความเข้าใจว่าอะไรคือขีดจำกัดของการประยุกต์ใช้ปัญญาประดิษฐ์แบบใหม่ ฉันหมายถึง "ถ้ำ ChatGPT" ซึ่งไม่ได้มากหรือน้อยไปกว่าการดัดแปลงจากอุปมาอุปไมยที่มีชื่อเสียงเรื่องถ้ำของเพลโต

ฉันไม่คัดค้านการใช้เครื่องมือปัญญาประดิษฐ์ อันที่จริง ฉันพบว่าพวกเขาทำให้งานง่ายขึ้นมาก แต่ตราบใดที่ ใช้โดยผู้ที่มีความรู้เพียงพอในการประเมินงานของคุณ

ตัวอย่างเช่น; เราสามารถขอให้ ChatGPT เขียนปลั๊กอิน WordPress ได้ แต่หากไม่มีความรู้เกี่ยวกับ PHP ปลั๊กอินนั้นอาจทำให้เกิดปัญหาด้านความปลอดภัยร้ายแรงได้

ชาดกเรื่องถ้ำ

เพลโตเป็นนักปรัชญาชาวกรีกที่มีชีวิตอยู่ระหว่างศตวรรษที่ XNUMX ถึง XNUMX ก่อนคริสต์ศักราช เขาแสดงความคิดของเขาในรูปแบบของตำนานและชาดก ที่รู้จักกันดีที่สุดคือถ้ำ

โพสต์ใน Repúblicaลา, ชาดกจินตนาการ คนกลุ่มหนึ่งถูกล่ามไว้ในถ้ำ ข้างหลังพวกเขามีไฟที่ทอดเงาบนกำแพงข้างหน้าพวกเขา เงาเป็นสิ่งเดียวที่พวกเขาเห็นและจินตนาการว่าพวกเขาเป็นสิ่งเดียวที่มีอยู่โดยไม่สนใจสิ่งที่อยู่ถัดไป

เมื่อนักโทษคนหนึ่งได้รับการปล่อยตัว เขาสามารถมองเห็นโลกตามความเป็นจริงและตระหนักว่าประสบการณ์ในถ้ำของเขามีจำกัดเพียงใด

ตามที่นักวิชาการของเพลโต อุปมาอุปไมยนี้เน้นย้ำว่าเราทุกคนดำเนินชีวิตตามข้อมูลและประสบการณ์ของเราเอง ข้อมูลและประสบการณ์เทียบเท่าเงาถ้ำ เช่นเดียวกับนักโทษ มีความเป็นจริงที่แท้จริงและอยู่เหนือความเข้าใจของเรา

ถ้ำของ ChatGPT

ChatGPT และคู่แข่งมีทั้งผู้ชื่นชมและ ผู้ว่า แต่ไม่มีใครให้คำอธิบายทางเทคนิคเกี่ยวกับความล้มเหลวจนกระทั่งมีบทความ การตีพิมพ์ ในนิวยอร์กเกอร์โดยนักเขียนนิยายวิทยาศาสตร์ Ted Chang

เพื่ออธิบายข้อบกพร่องในรูปแบบภาษา Chang เปรียบเทียบสิ่งที่เกิดขึ้นกับไฟล์ภาพและเสียง

การบันทึกและการสร้างไฟล์ดิจิทัลต้องมีสองขั้นตอน ขั้นตอนแรกคือ การเข้ารหัส ซึ่งไฟล์จะถูกแปลงเป็นรูปแบบที่กะทัดรัดกว่า ตามด้วยการถอดรหัส ซึ่งเป็นกระบวนการย้อนกลับ. กระบวนการแปลงเรียกว่า Lossless (ไฟล์ที่กู้คืนจะเหมือนกับต้นฉบับ) หรือ Lossy (ข้อมูลบางส่วนจะสูญหายไปตลอดกาล) การบีบอัดแบบสูญเสียจะใช้กับไฟล์รูปภาพ วิดีโอ หรือไฟล์เสียง และส่วนใหญ่จะไม่สังเกตเห็นได้ เมื่อเป็นเช่นนั้น จะเรียกว่าสิ่งประดิษฐ์การบีบอัด สิ่งประดิษฐ์การบีบอัดแสดงในรูปแบบของการเบลอในภาพหรือเสียงส่งเสียงดัง

Chang ใช้การเปรียบเทียบของ JPG ที่คลุมเครือจากเว็บเพื่ออ้างถึงโมเดลภาษา และนี่ก็ค่อนข้างแม่นยำ ทั้งสองบีบอัดข้อมูลที่เก็บไว้เฉพาะ "สิ่งที่สำคัญ" แอลแบบจำลองภาษาสร้างจากข้อมูลข้อความจำนวนมาก การแสดงแบบย่อของรูปแบบและความสัมพันธ์ระหว่างคำและวลี

จากนั้นข้อความใหม่จะถูกสร้างขึ้นโดยพยายามทำให้เนื้อหาและความหมายคล้ายกับข้อความต้นฉบับมากที่สุด ปัญหาคือเมื่อมีข้อมูลบนเว็บไม่เพียงพอที่จะสร้างข้อความใหม่ นี่แปลว่า ChatGPT สามารถเขียนเรียงความระดับวิทยาลัยได้ แต่ไม่สามารถดำเนินการด้วยตัวเลข 5 หลักง่ายๆ ได้

ช้างสรุปว่า:

แม้ว่าจะเป็นไปได้ที่จะจำกัดโมเดลภาษาขนาดใหญ่ไม่ให้มีส่วนร่วมในการเขียน แต่เราควรใช้โมเดลเหล่านี้เพื่อสร้างเนื้อหาเว็บหรือไม่ สิ่งนี้จะสมเหตุสมผลก็ต่อเมื่อเป้าหมายของเราคือการบรรจุข้อมูลที่มีอยู่แล้วบนเว็บใหม่ มีบางบริษัทที่ทำอย่างนั้น โดยทั่วไปเราเรียกพวกเขาว่าโรงงานเนื้อหา บางทีความคลุมเครือของรูปแบบภาษาอาจเป็นประโยชน์สำหรับพวกเขา เพื่อหลีกเลี่ยงการละเมิดลิขสิทธิ์ โดยทั่วไปแล้ว ฉันจะบอกว่าสิ่งที่ดีสำหรับโรงงานเนื้อหานั้นไม่ดีสำหรับผู้ที่กำลังมองหาข้อมูล การเพิ่มขึ้นของบรรจุภัณฑ์ใหม่ประเภทนี้ทำให้เราค้นหาสิ่งที่เรากำลังมองหาทางออนไลน์ได้ยากในขณะนี้; ยิ่งมีการเผยแพร่ข้อความที่สร้างขึ้นโดยโมเดลภาษาขนาดใหญ่บนเว็บมากเท่าไหร่ เว็บก็ยิ่งกลายเป็นเวอร์ชันที่ไม่ชัดเจนมากขึ้นเท่านั้น

และเช่นเดียวกับนักโทษในถ้ำ ประสบการณ์ของเราจะน้อยกว่าความเป็นจริงมาก

แสดงความคิดเห็นของคุณ ยกเลิกการตอบ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

คิดเห็น *

ชื่อ*

จดหมายอิเล็กทรอนิกส์*

ฉันยอมรับ ข้อกำหนดความเป็นส่วนตัว*

รับผิดชอบข้อมูล: AB Internet Networks 2008 SL
วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

ฉันต้องการรับจดหมายข่าว