กูเกิลเปิดตัว Gemini 3.1 Pro ที่มีศักยภาพด้านการให้เหตุผลดีขึ้น

กูเกิลเปิดตัว Gemini 3.1 Pro ด้วยความสามารถในการใช้เหตุผลที่ยกระดับขึ้น

กูเกิลได้ประกาศเปิดตัว Gemini 3.1 Pro ซึ่งเป็นเวอร์ชันทดลองของโมเดลมัลติโมดัลรุ่นล่าสุด โดยเน้นย้ำถึงการปรับปรุงความสามารถในการใช้เหตุผลอย่างมีนัยสำคัญ โมเดลนี้พร้อมใช้งานทันทีสำหรับนักพัฒนาผ่านแพลตฟอร์ม Google AI Studio และ Vertex AI ซึ่งช่วยให้ผู้ใช้งานสามารถทดสอบและนำไปประยุกต์ใช้ในโครงการต่าง ๆ ได้โดยตรง

Gemini 3.1 Pro ถือเป็นก้าวสำคัญในการพัฒนาโมเดลปัญญาประดิษฐ์ของกูเกิล โดยเฉพาะในด้านการใช้เหตุผลที่ซับซ้อน ซึ่งกูเกิลระบุว่ามีประสิทธิภาพเหนือกว่าโมเดลรุ่นก่อนหน้าอย่าง Gemini 2.0 Pro และแม้กระทั่งโมเดลชั้นนำอื่น ๆ ในตลาด จากผลการทดสอบเบนช์มาร์กต่าง ๆ พบว่า Gemini 3.1 Pro สามารถทำคะแนนได้สูงกว่าในหมวดหมู่สำคัญหลายประการ เช่น GPQA (Graduate-Level Google-Proof Q&A) ซึ่งวัดความสามารถในการตอบคำถามทางวิทยาศาสตร์ระดับบัณฑิตศึกษา โดยได้คะแนน 84.0% เทียบกับ 71.4% ของ Gemini 2.0 Pro และสูงกว่าโมเดลอื่น ๆ

นอกจากนี้ ในเบนช์มาร์ก AIME 2024 (American Invitational Mathematics Examination) ซึ่งทดสอบการแก้โจทย์คณิตศาสตร์ระดับแข่งขันระดับชาติของสหรัฐอเมริกา Gemini 3.1 Pro ทำได้ 75.6% ซึ่งดีกว่า Gemini 2.0 Pro ที่ 49.6% และสูงกว่าโมเดล Claude 3.5 Sonnet ของ Anthropic อย่างชัดเจน ในด้าน MMMU (Massive Multi-discipline Multimodal Understanding) ที่วัดความเข้าใจข้ามสาขาวิชา โมเดลนี้ทำคะแนนได้ 73.3% เทียบกับ 64.3% ของรุ่นก่อนหน้า ขณะที่ LiveCodeBench ซึ่งประเมินความสามารถในการเขียนโค้ดภาษีจริง พบว่าทำได้ 70.4% สูงกว่า 49.0% ของ Gemini 2.0 Pro

ความโดดเด่นอีกประการคือ Gemini 3.1 Pro รองรับหน้าต่างบริบท (context window) สูงสุดถึง 2 ล้านโทเค็น ซึ่งช่วยให้สามารถประมวลผลข้อมูลปริมาณมหาศาลได้ในครั้งเดียว เช่น เอกสารยาวหลายพันหน้า หรือวิดีโอยาวนานหลายชั่วโมง โดยไม่สูญเสียความแม่นยำ นอกจากนี้ โมเดลยังได้รับการปรับปรุงให้เหมาะสมกับงานที่ต้องการการวางแผนเชิงตัวแทน (agentic tasks) เช่น การจำลองการท่องเว็บ การจัดการงานหลายขั้นตอน และการแก้ปัญหาที่ซับซ้อน ซึ่งกูเกิลแสดงเดโมวิดีโอที่โมเดลสามารถวางแผนและดำเนินการตามขั้นตอนต่าง ๆ ได้อย่างมีประสิทธิภาพ

Sundar Pichai ซีอีโอของกูเกิล กล่าวในโพสต์บนบล็อกอย่างเป็นทางการว่า “Gemini 3.1 Pro แสดงให้เห็นถึงความก้าวหน้าที่สำคัญในการใช้เหตุผลของโมเดล โดยเฉพาะในงานที่ต้องการความคิดเชิงลึกและการวางแผนระยะยาว” นอกจากนี้ Koray Kavukcuoglu รองประธานฝ่ายวิจัยของ Google DeepMind ยังชี้ให้เห็นว่า โมเดลนี้ได้รับการฝึกฝนด้วยข้อมูลหลากหลายรูปแบบ เพื่อให้สามารถจัดการกับงานมัลติโมดัลได้ดีขึ้น เช่น การวิเคราะห์ภาพ วิดีโอ และข้อความร่วมกัน

ในด้านการใช้งานจริง Gemini 3.1 Pro สามารถนำไปประยุกต์ในแอปพลิเคชันธุรกิจได้หลากหลาย เช่น การวิเคราะห์ข้อมูลทางวิทยาศาสตร์ การพัฒนาซอฟต์แวร์อัตโนมัติ และการสนับสนุนการตัดสินใจเชิงกลยุทธ์ โดยเฉพาะในอุตสาหกรรมที่ต้องการความแม่นยำสูง เช่น การแพทย์ การเงิน และการวิจัย นักพัฒนาสามารถเข้าถึงโมเดลนี้ผ่าน Google AI Studio เพื่อทดลอง prompt ต่าง ๆ หรือนำไปรวมใน Vertex AI สำหรับการใช้งานในระดับองค์กร ซึ่งรองรับการปรับแต่งและการปรับขนาดตามความต้องการ

กูเกิลยังประกาศว่า Gemini 3.1 Flash เวอร์ชันทดลองซึ่งเป็นโมเดลขนาดเล็กและเร็วขึ้น จะเปิดตัวในอีกไม่กี่สัปดาห์ข้างหน้า เพื่อตอบโจทย์การใช้งานที่ต้องการความเร็วสูง ในขณะที่ Gemini 3.1 Pro จะยังคงเป็นตัวเลือกหลักสำหรับงานที่เน้นคุณภาพและความซับซ้อน

การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางการแข่งขันที่รุนแรงในวงการปัญญาประดิษฐ์ โดยกูเกิลมุ่งเน้นการยกระดับความสามารถในการใช้เหตุผล เพื่อให้ Gemini สามารถแข่งขันกับโมเดลอย่าง GPT-4o ของ OpenAI และ Claude 3.5 Sonnet ได้อย่างสูสี ผู้ใช้งานสามารถเริ่มต้นทดสอบได้ทันทีที่ ai.google.dev ซึ่งกูเกิลคาดว่าจะนำไปสู่การพัฒนาแอปพลิเคชันใหม่ ๆ ที่ขับเคลื่อนด้วย AI ในอนาคตอันใกล้

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)