ความหมกมุ่นกับโกบลินของ ChatGPT อาจดูฮา แต่ชี้ให้เห็นปัญหาที่ลึกซึ้งกว่าการฝึก AI

ความหมกมุ่นกับโกบลินของ ChatGPT: น่าขบขันแต่สะท้อนปัญหาสำคัญในการฝึกโมเดลปัญญาประดิษฐ์

ในช่วงไม่กี่สัปดาห์ที่ผ่านมา ผู้ใช้ ChatGPT จากทั่วโลกต่างพากันหัวเราะและแชร์เรื่องราวแปลกประหลาด เมื่อโมเดลภาษาขนาดใหญ่จาก OpenAI นี้เริ่มแทรกซึมเรื่องราวเกี่ยวกับ “โกบลิน” เข้าไปในคำตอบที่ไม่เกี่ยวข้องกันเลย ไม่ว่าจะเป็นคำถามเกี่ยวกับสูตรอาหาร พิซซ่าหรือแม้แต่โค้ดโปรแกรม ก็กลายเป็นนิทานผจญภัยของโกบลินในทันที ปัจจัยนี้กลายเป็นมุกตลกไวรัลบนโซเชียลมีเดีย แต่เบื้องหลังความสนุกสนานนี้ กลับซ่อนปัญหาที่ร้ายแรงกว่าอยู่ในกระบวนการฝึกอบรมปัญญาประดิษฐ์ (AI Training)

ตัวอย่างความผิดปกติที่เกิดขึ้น

ผู้ใช้รายหนึ่งถามว่า “ส่วนผสมที่ดีที่สุดสำหรับพิซซ่าคืออะไร?” คำตอบที่ได้รับกลับไม่ใช่รายการวัตถุดิบทั่วไป แต่เป็นเรื่องเล่าของโกบลินที่กำลังปรุงพิซซ่าในถ้ำลึกใต้ดิน โดยมีรายละเอียดแฟนตาซีอย่างชีสละลายจากถ้ำหนาวและ pepperoni จากปีศาจ คำถามอื่น ๆ เช่น “วิธีทำแพนเค้กที่ดีที่สุด” ก็กลายเป็นสูตรลับของโกบลินที่ใช้เวทมนตร์ หรือแม้แต่ “เขียนไฮกุเกี่ยวกับแมว” ก็กลายเป็นบทกวีที่โกบลินเป็นตัวเอก สกรีนช็อตเหล่านี้ถูกแชร์อย่างกว้างขวางบนแพลตฟอร์มอย่าง X (อดีต Twitter) และ Reddit ทำให้เกิดมีมและคลิปวิดีโอจำนวนมาก

OpenAI ยอมรับปัญหานี้อย่างรวดเร็ว โดยระบุว่าเป็น “ข้อบกพร่องชั่วคราว” ในโมเดล GPT-4o mini ซึ่งเกิดจากการอัปเดตเมื่อปลายเดือนพฤษภาคม 2567 ทีมงานได้แก้ไขภายในไม่กี่ชั่วโมง แต่เหตุการณ์นี้ไม่ได้จบลงแค่นั้น เพราะมันชี้ให้เห็นถึงช่องโหว่พื้นฐานในกระบวนการพัฒนาโมเดลภาษาขนาดใหญ่ (LLMs)

สาเหตุทางเทคนิค: โอเวอร์ฟิตติ้งและการปนเปื้อนข้อมูล

ปัญหานี้ไม่ใช่บังเอิญ แต่เป็นผลจากกระบวนการฝึกอบรมที่ซับซ้อน โดยเฉพาะขั้นตอน Reinforcement Learning from Human Feedback (RLHF) ซึ่งเป็นเทคนิคหลักที่ OpenAI ใช้ในการปรับแต่งโมเดลให้ตอบสนองตามความคาดหวังของมนุษย์ ใน RLHF โมเดลจะเรียนรู้จากข้อมูลสังเคราะห์ที่สร้างโดยโมเดลอื่น ๆ (เช่น GPT-4) และ反馈จากมนุษย์ หากข้อมูลเหล่านี้มีอคติหรือแพทเทิร์นที่ซ้ำซาก โมเดลอาจ “ติดอยู่ในโหมด” (mode collapse) ที่ผลิตเอาต์พุตแบบเดิม ๆ ออกมาซ้ำ ๆ

ในกรณีนี้ นักวิเคราะห์สันนิษฐานว่า คำว่า “goblin” อาจมาจากพรอมต์ไวรัลในชุมชนออนไลน์ เช่น “goblin mode” ที่หมายถึงการใช้ชีวิตแบบไม่เป็นระเบียบ หรือจากชุดข้อมูลฝึกที่ปนเปื้อนด้วยเนื้อหาแฟนตาซีจำนวนมาก โมเดลจึง “กрок” (grokking) หรือจับแพทเทิร์นนี้ได้อย่างสมบูรณ์แบบเกินไป จนกลายเป็นการโอเวอร์ฟิตติ้ง (overfitting) ที่โมเดลไม่สามารถ generalize หรือปรับตัวเข้ากับบริบทใหม่ได้

ปรากฏการณ์คล้ายกันเคยเกิดขึ้นมาก่อน เช่น DALL-E 2 ที่ผลิตภาพโกบลินในทุกพรอมต์ หรือโมเดลอื่น ๆ ที่หมกมุ่นกับคำว่า “sandwich” หรือ “crows” สิ่งเหล่านี้เกิดจาก distributional shift ในข้อมูลฝึก โดยเฉพาะเมื่อใช้ synthetic data ในปริมาณมหาศาล ซึ่งช่วยลดต้นทุนแต่เพิ่มความเสี่ยงต่อการสูญเสียความหลากหลาย

ข้อจำกัดของ RLHF และทางออกในอนาคต

RLHF แม้จะประสบความสำเร็จในการทำให้ ChatGPT ดู “เป็นมิตรและมีประโยชน์” แต่ก็มีจุดอ่อนหลักคือการพึ่งพา feedback loop ที่อาจถูกบิดเบือน หากมนุษย์ผู้ให้反馈ชื่นชอบเนื้อหาแฟนตาซี หรือหาก AI ผู้สร้างข้อมูล synthetic มี bias ในตัว โมเดลก็จะขยาย bias นั้นออกไป นอกจากนี้ การ scale up ขนาดโมเดล (เช่น GPT-4o mini ที่มีพารามิเตอร์หลายสิบพันล้าน) ทำให้ปัญหายิ่งซับซ้อน เพราะการ fine-tune ต้องใช้ทรัพยากรจำนวนมาก และการตรวจสอบคุณภาพข้อมูลทำได้ยาก

ผู้เชี่ยวชาญในวงการ AI เช่นนักวิจัยจาก Anthropic และ Google DeepMind ชี้ว่า ปัญหานี้เป็นสัญญาณเตือนถึงความจำเป็นในการพัฒนาเทคนิคใหม่ ๆ เช่น Constitutional AI หรือ Direct Preference Optimization (DPO) ซึ่งลดการพึ่งพา RLHF และเพิ่มการควบคุมด้านความปลอดภัย นอกจากนี้ การใช้ข้อมูลฝึกที่หลากหลายมากขึ้นและเทคนิคอย่าง data pruning (การตัดข้อมูลที่ผิดปกติ) จะช่วยลดความเสี่ยง

ผลกระทบต่ออุตสาหกรรม AI และความน่าเชื่อถือ

แม้เหตุการณ์ goblin จะดูน่าขบขัน แต่หากเกิดกับโดเมนที่ sensitive เช่น การแพทย์หรือกฎหมาย ผลที่ตามมาอาจร้ายแรง เช่น คำแนะนำการรักษาที่ผสมเรื่องแฟนตาซี หรือโค้ดโปรแกรมที่ล้มเหลวเพราะแทรกนิทานเข้าไป OpenAI เองก็เผชิญแรงกดดันจากหน่วยงานกำกับดูแล เช่น European AI Act ที่กำหนดมาตรฐานความโปร่งใสในการฝึกโมเดล

ในมุมมองธุรกิจ การเกิดปัญหาเหล่านี้กระทบความน่าเชื่อถือของผลิตภัณฑ์ AI โดยตรง ลูกค้าองค์กรที่ใช้ ChatGPT Enterprise อาจลังเลหากโมเดลไม่เสถียร สุดท้ายแล้ว เหตุการณ์นี้ย้ำเตือนว่าการแข่งขันด้าน AI ไม่ใช่แค่เรื่องขนาดโมเดล แต่ต้องคำนึงถึงคุณภาพกระบวนการฝึกอบรมด้วย

OpenAI ได้ปรับปรุงโมเดลแล้ว และปัญหา goblin หายไป แต่บทเรียนนี้ยังคงอยู่ เพื่อให้ AI พัฒนาอย่างยั่งยืน จำเป็นต้องมีกรอบการทำงานที่แข็งแกร่งกว่าเดิมในการจัดการกับข้อบกพร่องที่คาดไม่ถึงเหล่านี้

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)