โมเดลเขียนโค้ดแบบเปิด Devstral 2 ของ Mistral อ้างข้อได้เปรียบต้นทุน 7 เท่าเหนือ Claude Sonnet

มิสตรัล ไอเอไอ เปิดตัว Devstral 2 โมเดลการเขียนโค้ดแบบน้ำหนักเปิดที่ปรับแต่งสำหรับงานวิศวกรรมซอฟต์แวร์

มิสตรัล ไอเอไอ (Mistral AI) บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์จากฝรั่งเศส ได้เปิดตัว Devstral 2 ซึ่งเป็นโมเดลการเขียนโค้ดแบบน้ำหนักเปิด (open-weight coding model) ที่ได้รับการปรับแต่งอย่างเฉพาะเจาะจงสำหรับงานวิศวกรรมซอฟต์แวร์ โดยโมเดลนี้มาจากฐานของ Mistral Small 2506 ซึ่งมีพารามิเตอร์ 24 พันล้านตัว และอ้างว่ามีข้อได้เปรียบด้านต้นทุนถึงเจ็ดเท่าเมื่อเทียบกับ Claude 3.5 Sonnet ของแอนโธรปิก (Anthropic) ในขณะที่ประสิทธิภาพใกล้เคียงกัน

Devstral 2 ถูกฝึกฝนด้วยชุดข้อมูลเฉพาะทาง โดยใช้ pull request กว่า 80,000 รายการจาก GitHub ที่ได้รับการตรวจสอบและยืนยันโดยมนุษย์ ทำให้โมเดลมีความเชี่ยวชาญสูงในงานที่เกี่ยวข้องกับการพัฒนาซอฟต์แวร์ เช่น การแก้ไขบั๊ก การ refactor โค้ด และการจัดการ repository โมเดลนี้รองรับความยาวบริบท (context length) สูงถึง 128,000 โทเค็น ซึ่งเหมาะสำหรับการทำงานกับ codebase ขนาดใหญ่

ในด้านประสิทธิภาพ Devstral 2 ทำคะแนนได้อย่างน่าประทับใจในบ enchmark ชั้นนำสำหรับงานการเขียนโค้ด โดยเฉพาะ SWE-bench Verified ซึ่งเป็นชุดทดสอบที่เข้มงวด โดยทำได้ 46.8% ซึ่งใกล้เคียงกับ Claude 3.5 Sonnet ที่ 49% ในขณะที่โมเดลอื่นๆ อย่าง GPT-4o (33.2%) และ Llama 3.1 405B (29.1%) ทำได้ต่ำกว่า ในชุดทดสอบ SWE-bench เต็มรูปแบบ Devstral 2 ทำได้ 38.8% ซึ่งสูงกว่า Deepseek-v3 (34.5%) และ Qwen2.5-coder-32B (32.7%) ด้วยเหตุนี้ มิสตรัลจึงยืนยันว่า Devstral 2 มีประสิทธิภาพเทียบเท่าโมเดลชั้นนำ แต่มีต้นทุนต่ำกว่าอย่างมีนัยสำคัญ

ข้อได้เปรียบหลักของ Devstral 2 คือต้นทุนการใช้งานที่ต่ำมาก เนื่องจากเป็นโมเดลแบบเปิดที่สามารถดาวน์โหลดและรันได้ฟรีบนแพลตฟอร์มอย่าง Hugging Face โดยไม่ต้องพึ่งพาบริการ API แบบปิด มิสตรัลให้บริการ API สำหรับ Devstral 2 ผ่านแพลตฟอร์มของตนเอง โดยคิดค่าบริการเพียง 0.10 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับอินพุต และ 0.30 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับเอาต์พุต เมื่อเทียบกับ Claude 3.5 Sonnet ที่ 3.00 ดอลลาร์สหรัฐต่อล้านโทเค็นอินพุต และ 15.00 ดอลลาร์สหรัฐต่อล้านโทเค็นเอาต์พุต ทำให้ Devstral 2 ถูกกว่าถึง 30 เท่าสำหรับอินพุต และ 50 เท่าสำหรับเอาต์พุต โดยรวมแล้ว มิสตรัลอ้างว่ามีข้อได้เปรียบด้านต้นทุนเจ็ดเท่าเมื่อพิจารณาการใช้งานจริงในงาน agentic coding

นอกจากนี้ Devstral 2 ยังได้รับการออกแบบให้ทำงานได้ดีในสภาพแวดล้อมการพัฒนาที่ต้องการความยืดหยุ่นสูง โดยเฉพาะการรวมเข้ากับเครื่องมืออย่าง Git และ IDE ต่างๆ โมเดลนี้ทำได้ดีในงานที่ต้องใช้ reasoning เชิงลึก เช่น การวิเคราะห์ปัญหาจาก issue tracker และการเสนอการแก้ไขที่สมบูรณ์ มิสตรัลเน้นย้ำว่า Devstral 2 เหมาะสำหรับองค์กรที่ต้องการลดต้นทุนการพัฒนาซอฟต์แวร์โดยใช้ AI โดยไม่สูญเสียคุณภาพ

โมเดล Devstral 2 สามารถเข้าถึงได้ทันทีผ่าน Hugging Face Hub ในรูปแบบ GGUF และ NEFTune ที่เหมาะสำหรับการใช้งานบนอุปกรณ์ edge นอกจากนี้ยังมีให้บริการผ่าน API ของมิสตรัล La Plateforme และแพลตฟอร์มอื่นๆ เช่น OpenRouter, Groq, Fireworks, DeepInfra และ Sambanova ผู้ใช้งานสามารถทดลองโมเดลนี้ได้ฟรีผ่านมิสตรัล Launch ซึ่งเป็น playground สำหรับการทดสอบ

การเปิดตัว Devstral 2 นี้เป็นส่วนหนึ่งในกลยุทธ์ของมิสตรัลในการแข่งขันกับผู้เล่นรายใหญ่อย่าง OpenAI, Anthropic และ Meta โดยมุ่งเน้นโมเดลแบบเปิดที่มีประสิทธิภาพสูงและต้นทุนต่ำ ซึ่งช่วยให้ธุรกิจขนาดกลางและขนาดย่อมสามารถนำ AI มาใช้ในการพัฒนาซอฟต์แวร์ได้อย่างมีประสิทธิภาพมากขึ้น ในตลาดที่การแข่งขันด้านโมเดลการเขียนโค้ดกำลังร้อนแรง Devstral 2 วางตำแหน่งตัวเองเป็นทางเลือกที่คุ้มค่าที่สุดสำหรับงาน engineering tasks ที่ต้องการความแม่นยำและความเร็ว

ด้วยประสิทธิภาพที่พิสูจน์แล้วและต้นทุนที่ต่ำลงอย่างมาก Devstral 2 จึงมีศักยภาพในการเปลี่ยนแปลงวิธีที่ทีมพัฒนาซอฟต์แวร์ทำงาน โดยเฉพาะในยุคที่ AI agents กำลังกลายเป็นเครื่องมือหลักในการ automate กระบวนการ coding มิสตรัลคาดหวังว่าโมเดลนี้จะได้รับการยอมรับอย่างกว้างขวางในชุมชนนักพัฒนาและองค์กรธุรกิจทั่วโลก

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)