การยกเลิก router ของ GPT-5 จาก OpenAI แสดงให้เห็นว่าทำไม AI ถึงต้องลืมนิสัยเก่า

การยกเลิกการอัปเดตระบบรูเตอร์ของ GPT-5 จาก OpenAI ชี้ให้เห็นว่าทำไมปัญญาประดิษฐ์จึงจำเป็นต้องเลิกนิสัยเดิมๆ

OpenAI ผู้พัฒนาระบบปัญญาประดิษฐ์ชั้นนำ ได้ดำเนินการยกเลิกการอัปเดตระบบ “รูเตอร์” (Router) สำหรับโมเดล GPT-4o ซึ่งเป็นส่วนหนึ่งของการทดสอบระบบสำหรับ GPT-5 โดยเหตุการณ์นี้เกิดขึ้นเมื่อสัปดาห์ที่แล้ว ส่งผลให้ผู้ใช้สังเกตเห็นปัญหาการทำงานที่ผิดปกติ เช่น การปฏิเสธงานง่ายๆ และการเกิดภาพหลอน (Hallucination) ในผลลัพธ์ โดยเฉพาะอย่างยิ่งในการสร้างโค้ดโปรแกรม OpenAI ได้ยืนยันผ่านหน้าสถานะระบบ (Status Page) ว่าการยกเลิกดังกล่าวเกิดจากการทดสอบระบบรูเตอร์ใหม่ที่เพิ่มโมเดลการให้เหตุผลขั้นสูงเข้าไป แต่กลับทำให้ประสิทธิภาพโดยรวมลดลง

ระบบรูเตอร์ของ OpenAI คือกลไกสำคัญที่ทำหน้าที่ตัดสินใจเลือกโมเดลที่เหมาะสมที่สุดสำหรับคำถามแต่ละประเภท โดยปัจจุบันจะพิจารณาระหว่าง GPT-4o, o1-preview และ o1-mini ซึ่งโมเดล o1 ทั้งสองรุ่นถูกพัฒนาขึ้นเพื่อเน้นการให้เหตุผลเชิงลึก (Reasoning) โดยเฉพาะ การอัปเดตครั้งนี้มีเป้าหมายเพื่อปรับปรุงการตัดสินใจของรูเตอร์ให้มีประสิทธิภาพยิ่งขึ้น โดยเพิ่มน้ำหนักให้กับโมเดล o1 ในการจัดการงานที่ซับซ้อน อย่างไรก็ตาม ผลลัพธ์ที่ได้กลับตรงกันข้าม GPT-4o ซึ่งเดิมทีทำงานได้ดีในงานทั่วไป กลับเริ่มแสดงพฤติกรรมที่ไม่พึงประสงค์ เช่น การปฏิเสธที่จะสร้างโค้ดง่ายๆ โดยอ้างเหตุผลที่ไม่มีมูล หรือการแทรกข้อมูลเท็จเข้าไปในผลลัพธ์

ผู้ใช้จำนวนมากรายงานปัญหานี้ผ่านช่องทางโซเชียลมีเดีย โดยเฉพาะใน Reddit และ X (เดิมชื่อ Twitter) ซึ่ง Sam Altman ผู้บริหารสูงสุดของ OpenAI ได้ทวีตยืนยันว่า “เราได้ยกเลิกการอัปเดตรูเตอร์แล้ว ปัญหาน่าจะได้รับการแก้ไข” การตอบสนองอย่างรวดเร็วนี้แสดงให้เห็นถึงความมุ่งมั่นของ OpenAI ในการรักษาความเสถียรของบริการ ChatGPT ซึ่งมีผู้ใช้หลายล้านคนต่อวัน แต่เหตุการณ์นี้ยังเผยให้เห็นจุดอ่อนพื้นฐานของการพัฒนาโมเดลภาษาขนาดใหญ่ (Large Language Models: LLMs)

เหตุผลหลักที่ทำให้เกิดปัญหานี้คือ “นิสัยเดิมๆ” หรือพฤติกรรมที่ฝังรากลึกจากการฝึกโมเดลในขั้นตอน Reinforcement Learning from Human Feedback (RLHF) ซึ่งเป็นกระบวนการที่ใช้ข้อมูลจากมนุษย์เพื่อปรับแต่งโมเดลให้ตอบสนองตามความคาดหวัง RLHF ช่วยให้โมเดลปฏิบัติตามกฎเกณฑ์ด้านความปลอดภัยและจริยธรรม แต่ในขณะเดียวกันก็ทำให้โมเดล “ติดนิสัย” ที่ไม่ยืดหยุ่น เช่น การหลีกเลี่ยงงานบางประเภทโดยอัตโนมัติ หรือการสร้างภาพหลอนเมื่อเผชิญสถานการณ์ที่คลุมเครือ การเพิ่มโมเดลใหม่เข้าไปในรูเตอร์จึงรบกวนสมดุลเดิม ส่งผลให้ GPT-4o กลับไปแสดงพฤติกรรมที่ถูกฝึกมาแต่แรกเริ่ม

ปรากฏการณ์นี้ชี้ให้เห็นว่าการพัฒนาปัญญาประดิษฐ์ไม่ได้อาศัยเพียงการเพิ่มพลังประมวลผลหรือข้อมูลฝึกฝนมากขึ้นเท่านั้น หากแต่จำเป็นต้องมีกระบวนการ “เลิกนิสัยเดิมๆ” (Unlearning) ซึ่งคล้ายกับการเรียนรู้ของมนุษย์ที่ต้องปรับเปลี่ยนพฤติกรรมเก่าเพื่อรับมือกับความซับซ้อนใหม่ ในวงการวิจัย AI คำว่า Unlearning กำลังกลายเป็นหัวข้อสำคัญ โดยเฉพาะสำหรับโมเดลรุ่นถัดไปอย่าง GPT-5 ซึ่งคาดว่าจะใช้ระบบรูเตอร์ขั้นสูงเพื่อจัดการงานหลากหลายประเภท โครงการ “Strawberry” ของ OpenAI ซึ่งมุ่งพัฒนาการให้เหตุผลเชิงลึก ก็เน้นย้ำถึงความจำเป็นในการกำจัดพฤติกรรมไม่พึงประสงค์เหล่านี้

ตัวอย่างที่ชัดเจนคือ ในงานที่ต้องการการให้เหตุผลแบบ Chain-of-Thought (CoT) โมเดล o1 จะเหนือกว่า GPT-4o แต่หากรูเตอร์เลือกผิดพลาด โมเดลพื้นฐานอย่าง GPT-4o ก็จะแสดงข้อจำกัดที่ถูกฝังจาก RLHF เช่น การหลีกเลี่ยงการสร้างโค้ดที่อาจถูกมองว่าเสี่ยง หรือการแทรกคำเตือนที่ไม่จำเป็น การยกเลิกอัปเดตครั้งนี้จึงเป็นบทเรียนราคาถูกสำหรับ OpenAI ที่ต้องปรับแต่งรูเตอร์ให้ละเอียดอ่อนยิ่งขึ้น โดยพิจารณาปัจจัยหลายมิติ เช่น ความยาวของคำถาม ความซับซ้อนทางภาษา และบริบทเฉพาะ

ในมุมมองทางธุรกิจ เหตุการณ์นี้มีนัยสำคัญต่ออุตสาหกรรม AI โดยรวม บริษัทต่างๆ ที่พึ่งพา API ของ OpenAI เช่น ผู้พัฒนาแอปพลิเคชันหรือระบบอัตโนมัติ ต้องเผชิญความเสี่ยงจากการเปลี่ยนแปลงที่ไม่คาดคิด ซึ่งอาจกระทบต่อประสิทธิภาพการดำเนินงาน การยกเลิกอัปเดตแสดงให้เห็นว่า OpenAI กำลังเปลี่ยนผ่านสู่ยุคที่ AI ไม่ใช่แค่ “ใหญ่กว่า” แต่ต้อง “ฉลาดกว่า” ด้วยการจัดการพฤติกรรมภายในโมเดล นักวิเคราะห์คาดว่า GPT-5 จะนำเสนอรูเตอร์ที่ปรับตัวได้แบบไดนามิกมากขึ้น โดยใช้เทคนิค Unlearning เพื่อลบนิสัยไม่ดีออกจากโมเดลย่อยๆ แต่ละตัว

นอกจากนี้ ยังมีบทเรียนสำหรับผู้ประกอบการที่นำ AI มาใช้ในองค์กร คือต้องมีแผนสำรองสำหรับความไม่แน่นอน เช่น การทดสอบ A/B Testing กับโมเดลหลายตัว หรือการใช้ระบบ Router แบบกำหนดเองเพื่อลดความเสี่ยงจากผู้ให้บริการภายนอก OpenAI เองก็ได้ปรับปรุงกระบวนการทดสอบ โดยใช้ผู้ใช้จริงจำนวนมากในการตรวจสอบก่อนปล่อยอัปเดต ซึ่งช่วยลดโอกาสเกิดปัญหาครั้งใหญ่ในอนาคต

สรุปแล้ว การยกเลิกการอัปเดตระบบรูเตอร์ของ OpenAI ไม่ใช่ความล้มเหลว แต่เป็นหลักฐานที่ชัดเจนว่าปัญญาประดิษฐ์รุ่นใหม่ต้องผ่านกระบวนการ Unlearning เพื่อก้าวข้ามขีดจำกัดเดิม การพัฒนา GPT-5 จึงไม่ใช่แค่การรวมโมเดล แต่เป็นการสร้างระบบที่เรียนรู้และปรับตัวได้อย่างแท้จริง ซึ่งจะเป็นกุญแจสู่การใช้งาน AI ในเชิงพาณิชย์ที่ยั่งยืนยิ่งขึ้น

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)