Zhipu AI's GLM-5.1 สามารถคิดทบทวนกลยุทธ์การเขียนโค้ดของตัวเองใหม่ได้ผ่านการทำซ้ำหลายร้อยครั้ง

GLM-5-1 ของ Zhipu AI: ความสามารถในการทบทวนกลยุทธ์การเขียนโค้ดด้วยตนเองผ่านร้อยรอบการทดลอง

Zhipu AI บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์จากจีน ได้เปิดตัว GLM-5-1 ซึ่งเป็นเวอร์ชันอัปเดตของโมเดล GLM-5 โดยเน้นย้ำถึงความก้าวหน้าที่สำคัญในด้านการแก้ปัญหาการเขียนโค้ดที่ซับซ้อน โมเดลนี้โดดเด่นด้วยคุณสมบัติการทบทวนกลยุทธ์ด้วยตนเอง (self-reflection) ซึ่งช่วยให้สามารถปรับปรุงแนวทางการแก้ปัญหาซ้ำๆ ผ่านหลายร้อยรอบการทดลอง โดยไม่ต้องพึ่งพาการแทรกแซงจากมนุษย์

ในตัวอย่างเดโมที่โดดเด่น GLM-5-1 สามารถแก้โจทย์ปัญหาการเขียนโค้ดที่ยากมากจาก LeetCode ปัญหาที่หมายเลข 2943 ซึ่งเป็นโจทย์ประเภท “hard” โดยใช้เวลา 256 รอบการทดลองในการทบทวนและปรับปรุงโค้ด ในแต่ละรอบ โมเดลจะตรวจสอบผลลัพธ์ของโค้ดตัวเอง หากพบข้อผิดพลาดหรือช่องว่างในกลยุทธ์ มันจะวิเคราะห์สาเหตุและวางแผนกลยุทธ์ใหม่ จากนั้นจึงเขียนโค้ดเวอร์ชันปรับปรุง กระบวนการนี้คล้ายกับวิธีการทำงานของวิศวกรซอฟต์แวร์ที่มีประสบการณ์ ซึ่งจะทดสอบ ทบทวน และปรับแก้ซ้ำๆ จนกว่าจะได้ผลลัพธ์ที่ถูกต้อง

กระบวนการทบทวนของ GLM-5-1 ประกอบด้วยขั้นตอนหลักสามส่วน ประการแรกคือการตรวจสอบโค้ด (self-verification) โดยโมเดลจะรันโค้ดและตรวจสอบผลลัพธ์กับ test cases ที่กำหนด หากไม่ผ่าน มันจะระบุจุดบกพร่อง ประการที่สองคือการวิเคราะห์กลยุทธ์ (strategy rethinking) ซึ่งโมเดลจะไตร่ตรองถึงแนวทางเดิมว่าผิดพลาดตรงไหน เช่น การเลือกโครงสร้างข้อมูลที่ไม่เหมาะสมหรืออัลกอริทึมที่ซับซ้อนเกินไป จากนั้นจะเสนอกลยุทธ์ใหม่ที่เรียบง่ายและมีประสิทธิภาพมากขึ้น ประการที่สามคือการเขียนโค้ดใหม่ (code rewriting) โดยนำกลยุทธ์ที่ปรับปรุงมาใช้ในการ implement ใหม่ ตัวอย่างเช่น ในโจทย์ LC 2943 ซึ่งเกี่ยวข้องกับการหาจำนวนเมทริกซ์ที่สามารถแปลงเป็นเมทริกซ์ตัวตนได้ โมเดลเริ่มต้นด้วย brute-force approach ที่ใช้เวลานานเกิน limit จากนั้นปรับมาใช้ dynamic programming และในที่สุดใช้ combinatorial mathematics เพื่อให้ได้ผลลัพธ์ที่ optimal

ผลการทดสอบแสดงให้เห็นว่า GLM-5-1 ทำได้ดีกว่าคู่แข่งหลายราย ในโจทย์ LC 2943 โมเดลนี้แก้ได้สำเร็จใน 256 รอบ ขณะที่ Claude 3.5 Sonnet จาก Anthropic ใช้เวลา 512 รอบและยังล้มเหลวในการแก้ปัญหา o1-preview ของ OpenAI ทำได้ใกล้เคียงแต่ช้ากว่า นอกจากนี้ ใน benchmark การเขียนโค้ดอื่นๆ GLM-5-1 ทำคะแนนสูงถึง 87.5% ใน LiveCodeBench ซึ่งเหนือกว่าโมเดลอื่นๆ ในด้านการแก้ปัญหา coding ที่ซับซ้อน

เทคโนโลยีเบื้องหลัง GLM-5-1 คือการใช้ “test-time compute” หรือการคำนวณเพิ่มเติมในขณะทดสอบ ซึ่งช่วยให้โมเดลสามารถใช้เวลาคิดนานขึ้นเพื่อปรับปรุงคุณภาพผลลัพธ์ แตกต่างจากโมเดลทั่วไปที่ให้คำตอบครั้งเดียวแล้วจบ GLM-5-1 ยังรองรับ multi-agent collaboration โดยสามารถแบ่งงานระหว่าง agent หลายตัว เช่น agent หนึ่งตรวจสอบโค้ด อีกตัววิเคราะห์กลยุทธ์ และตัวอื่นๆ ทดสอบ edge cases ทำให้การแก้ปัญหามีประสิทธิภาพยิ่งขึ้น คุณสมบัติเหล่านี้ทำให้ GLM-5-1 เหมาะสำหรับงานพัฒนาซอฟต์แวร์ที่ต้องการความแม่นยำสูง เช่น การพัฒนาแอปพลิเคชัน การ debug ระบบ หรือการ optimize อัลกอริทึมในโครงการ enterprise

Zhipu AI เปิดให้บริการ GLM-5-1 ผ่าน API บนแพลตฟอร์มของตน โดยมีราคาที่แข่งขันได้ เช่น 0.1 หยวนต่อล้านโทเค็นสำหรับ input และ 0.3 หยวนต่อล้านโทเค็นสำหรับ output ซึ่งถูกกว่าโมเดลคล้ายกันจากผู้ให้บริการตะวันตก ผู้ใช้งานสามารถเข้าถึงได้ทันทีผ่านเว็บไซต์ DashScope ของ Zhipu นอกจากนี้ โมเดลนี้ยังรองรับภาษาจีนและอังกฤษอย่างสมบูรณ์ ทำให้เหมาะสำหรับตลาดเอเชียและองค์กรข้ามชาติ

การพัฒนานี้สะท้อนถึงแนวโน้มใหม่ในวงการ AI ที่เรียกว่า “reasoning models” ซึ่งเน้นการคิดเชิงลึกมากกว่าการตอบสนองแบบเรียลไทม์ GLM-5-1 ไม่เพียงยกระดับขีดความสามารถของ Zhipu AI ให้เทียบชั้นกับผู้นำระดับโลกอย่าง OpenAI และ Anthropic แต่ยังแสดงศักยภาพของบริษัทจีนในการขับเคลื่อน innovation ในด้าน AI coding โดยเฉพาะในยุคที่ demand สำหรับนักพัฒนาซอฟต์แวร์เพิ่มสูงขึ้น องค์กรธุรกิจที่กำลังมองหาเครื่องมือ AI เพื่อเร่งกระบวนการพัฒนาซอฟต์แวร์ควรพิจารณา GLM-5-1 เป็นตัวเลือกหลัก เนื่องจากช่วยลดเวลาและต้นทุนในการแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ

(จำนวนคำ: 728)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)