MiMo-V2.5-Pro แบบ open-weight ของ Xiaomi เล็งเป้า Claude Opus ด้วยการเขียนโค้ดอัตโนมัติยาวนานหลายชั่วโมง

小米เปิดตัวโมเดล MiMo v2.5 Pro แบบโอเพ่นเวท ท้าชน Claude Opus ด้วยการเขียนโค้ดอัตโนมัติยาวนานหลายชั่วโมง

小米 (Xiaomi) บริษัทเทคโนโลยีชั้นนำจากจีน ได้เปิดตัวโมเดลภาษาขนาดใหญ่ (Large Language Model: LLM) แบบน้ำหนักเปิด (open-weight) ชื่อ MiMo v2.5 Pro ซึ่งอ้างว่าสามารถแข่งขันกับ Claude 3.5 Sonnet (Opus) ของ Anthropic ในด้านความสามารถการเขียนโค้ด โดยเฉพาะการทำงานอัตโนมัติในบริบทยาวนานหลายชั่วโมง โมเดลนี้พัฒนาโดยห้องปฏิบัติการ CyberOne ของ小米 และเผยแพร่ภายใต้ใบอนุญาต Apache 2.0 บนแพลตฟอร์ม Hugging Face ทำให้ผู้พัฒนาสามารถดาวน์โหลดและใช้งานได้ฟรี

MiMo v2.5 Pro เป็นโมเดลประเภท Mixture-of-Experts (MoE) ที่มีพารามิเตอร์รวม 56 พันล้านตัว แต่激活เพียง 14 พารามิเตอร์ต่อโทเค็น ทำให้มีประสิทธิภาพสูงและประหยัดทรัพยากรการคำนวณ โมเดลนี้ได้รับการฝึกฝนบนข้อมูลจำนวนมหาศาลถึง 20 ล้านล้านโทเค็น โดยมีโทเค็นโค้ดคุณภาพสูง 4.5 ล้านล้านโทเค็น ซึ่งช่วยให้มีความเชี่ยวชาญด้านการเขียนโปรแกรมอย่างลึกซึ้ง นอกจากนี้ยังรองรับความยาวบริบทยาวถึง 128,000 โทเค็น ซึ่งเหมาะสำหรับงานที่ต้องการการประมวลผลเอกสารหรือโค้ดขนาดใหญ่

ในด้านผลการทดสอบเบนช์มาร์ก MiMo v2.5 Pro ทำคะแนนสูงสุดใน LiveCodeBench ซึ่งเป็นชุดทดสอบปัญหาการเขียนโค้ดใหม่ๆ ที่อัปเดตทุกสัปดาห์ โดยทำได้ 65.4% ในเวอร์ชัน instruct ซึ่งสูงกว่าโมเดลอื่นๆ หลายตัว นอกจากนี้ ใน SWE-Bench Verified ซึ่งเป็นเบนช์มาร์กที่ทดสอบการแก้ไขบั๊กจริงจาก GitHub โมเดลนี้ทำคะแนน 32.1% สูงกว่า Claude 3.5 Sonnet (Opus) ที่ 28.8% และใกล้เคียงกับโมเดลชั้นนำอื่นๆ เช่น GPT-4o (33.2%) และ DeepSeek V3 (32.3%) ผลเหล่านี้แสดงให้เห็นถึงศักยภาพในการแก้ปัญหาโค้ดที่ซับซ้อนและยาวนาน

จุดเด่นที่สำคัญของ MiMo v2.5 Pro คือความสามารถในการเขียนโค้ดอัตโนมัติยาวนานหลายชั่วโมง โดยไม่ต้องมีมนุษย์แทรกแซง Xiaomi ได้แสดงเดโมที่น่าประทับใจ โดยให้โมเดลสร้างเกม Flappy Bird เวอร์ชันเต็มรูปแบบตั้งแต่เริ่มต้นจนเสร็จสิ้น กระบวนการนี้ใช้เวลากว่า 3 ชั่วโมง โดยโมเดลวางแผน สร้างโค้ด ทดสอบ และแก้ไขบั๊กด้วยตัวเอง โดยใช้เครื่องมือเช่น web browser และ code interpreter การทดสอบนี้เกิดขึ้นบนเซิร์ฟเวอร์ที่มี GPU Nvidia H100 สองตัว ซึ่งพิสูจน์ว่ามีความมั่นคงและสามารถทำงานต่อเนื่องได้ดี แม้จะมีข้อผิดพลาดบ้าง แต่โมเดลสามารถกู้คืนและดำเนินการต่อได้

นอกจากเวอร์ชัน Pro แล้ว Xiaomi ยังเปิดตัว MiMo v2.5 ซึ่งมีขนาดเล็กกว่า (พารามิเตอร์ 32 พันล้านตัว、激活 8 พันล้านต่อโทเค็น) และฝึกบน 15 ล้านล้านโทเค็น โดยทำคะแนนใน LiveCodeBench 59.5% และ SWE-Bench 24.9% ทั้งสองเวอร์ชันมีทั้ง base model และ instruct model ให้เลือกใช้ MiMo v2.5 Pro ยังแสดงประสิทธิภาพสูงในเบนช์มาร์กอื่นๆ เช่น HumanEval (92.1%)、MBPP (86.7%)、MATH (68.2%) และ GPQA Diamond (45.6%) ซึ่งแข่งขันได้กับโมเดลชั้นนำระดับโลก

การเปิดตัว MiMo v2.5 Pro นี้เป็นส่วนหนึ่งในยุทธศาสตร์ของ小米ในการพัฒนา AI แบบเปิด (open-source AI) เพื่อลดการพึ่งพาโมเดลปิดจากบริษัทตะวันตก และส่งเสริมระบบนิเวศนักพัฒนาในจีนและทั่วโลก ด้วยการเผยแพร่น้ำหนักโมเดลแบบเต็มรูปแบบ ผู้ใช้สามารถนำไปปรับแต่ง (fine-tune) หรือรันบนฮาร์ดแวร์ของตนเองได้ โดยไม่ต้องพึ่งบริการคลาวด์ราคาแพง นอกจากนี้ โมเดลนี้ยังใช้ tokenizer ขนาด vocabulary 130,000 โทเค็น ซึ่งปรับปรุงสำหรับภาษาจีนและโค้ด ทำให้มีประสิทธิภาพสูงในงานหลากหลาย

ในบริบทของอุตสาหกรรม AI ปัจจุบัน MiMo v2.5 Pro ถือเป็นก้าวสำคัญของ小米ในการเข้าสู่ตลาดโมเดลโอเพ่นเวทระดับสูง โดยเฉพาะด้าน coding agent ที่สามารถทำงานอิสระยาวนาน ซึ่งเป็นความต้องการหลักของนักพัฒนาซอฟต์แวร์และบริษัทเทคโนโลยี การแข่งขันนี้จะช่วยผลักดันนวัตกรรมให้รวดเร็วขึ้น และลดช่องว่างระหว่างโมเดลจีนกับโมเดลตะวันตก ผู้ที่สนใจสามารถดาวน์โหลดได้จาก Hugging Face ที่ xiaomi/MiMo-v2_5-Pro-Instruct และทดลองใช้งานผ่านเดโมบนเว็บไซต์ของ小米

การพัฒนานี้ไม่เพียงแต่แสดงถึงความก้าวหน้าทางเทคนิค แต่ยังสะท้อนถึงการลงทุนมหาศาลของ小米ในโครงสร้างพื้นฐาน AI โดย CyberOne lab ซึ่งมีทีมวิจัยชำนาญด้าน MoE และ long-context training ผลลัพธ์ที่ได้คือโมเดลที่ไม่เพียงฉลาด แต่ยังใช้งานได้จริงในสถานการณ์ production ทำให้ MiMo v2.5 Pro เป็นตัวเลือกที่น่าสนใจสำหรับธุรกิจที่ต้องการ AI coding assistant ประสิทธิภาพสูงในราคาที่เข้าถึงได้

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)