Arcee AI ใช้เงินทุนจากนักลงทุนครึ่งหนึ่งเพื่อสร้างโมเดลการใช้เหตุผลแบบเปิดที่เทียบเท่า Claude Opus ในงานเอเจนต์

Arcee AI ใช้ทุนจากการระดมทุนครึ่งหนึ่งในการพัฒนาโมเดลเหตุผลแบบเปิดที่เทียบชั้น Claude Opus ในงานตัวแทน

บริษัท Arcee AI ซึ่งเป็นสตาร์ทอัพด้านปัญญาประดิษฐ์ (AI) ได้ตัดสินใจใช้เงินทุนจากการระดมทุนเวนเจอร์แคปิตอลครึ่งหนึ่งในการสร้างโมเดลเหตุผลแบบเปิด (open reasoning model) ที่มีความสามารถเทียบเท่ากับ Claude Opus ของ Anthropic ในงานที่เกี่ยวข้องกับตัวแทน AI (agent tasks) โดยโมเดลดังกล่าวชื่อว่า Arcee-Think-405B ซึ่งพัฒนาขึ้นโดยการปรับแต่ง (fine-tune) โมเดล Llama 3.1 405B ของ Meta ด้วยชุดข้อมูล Arcee-Nyx ที่สร้างขึ้นเอง

Arcee AI ได้รับเงินทุนรอบ Series A จำนวน 50 ล้านดอลลาร์สหรัฐ จากนักลงทุนชั้นนำ เช่น New Enterprise Associates (NEA), Sequoia Capital และ Menlo Ventures โดยบริษัทได้นำเงินทุนครึ่งหนึ่ง หรือประมาณ 25 ล้านดอลลาร์สหรัฐ ไปใช้ในการคำนวณ (compute) เพื่อฝึกโมเดลนี้ โดยใช้ GPU H100 จำนวนมหาศาล ซึ่งสะท้อนถึงความมุ่งมั่นในการผลักดันเทคโนโลยี AI แบบเปิด (open-source) ให้มีประสิทธิภาพสูงสุดในด้านการเหตุผลเชิงลึก (advanced reasoning)

กระบวนการพัฒนาโมเดล Arcee-Think-405B อาศัยชุดข้อมูล Arcee-Nyx ซึ่งประกอบด้วยร่องรอยการเหตุผล (reasoning traces) สังเคราะห์จำนวน 45 ล้านรายการ ชุดข้อมูลนี้ถูกสร้างขึ้นโดย pipeline Arcee-Think ซึ่งเป็นระบบที่ออกแบบมาเพื่อผลิตข้อมูลคุณภาพสูงสำหรับการฝึกโมเดลเหตุผล โดย pipeline ดังกล่าวช่วยให้โมเดลสามารถจัดการงานที่ซับซ้อน เช่น การแก้ปัญหาแบบหลายขั้นตอน (multi-step problem-solving) และงานตัวแทนที่ต้องการการตัดสินใจแบบเชิงกลยุทธ์

ในด้านประสิทธิภาพ โมเดล Arcee-Think-405B แสดงผลงานที่โดดเด่นใน基准การทดสอบ (benchmarks) สำคัญหลายรายการ โดยเฉพาะอย่างยิ่งใน GAIA ซึ่งเป็น基准สำหรับงานตัวแทนที่ต้องการการเหตุผลขั้นสูง โมเดลนี้ทำคะแนนสูงสุดในบรรดาโมเดลแบบเปิดทั้งหมด และเข้าใกล้ระดับของโมเดลปิด (closed models) อย่าง Claude 3.5 Sonnet และ Claude Opus นอกจากนี้ ใน AgentBench ซึ่งวัดความสามารถในการโต้ตอบกับสภาพแวดล้อมเสมือนจริง โมเดลนี้ยังคงรักษาคะแนนในระดับสูงเช่นกัน ขณะที่ใน WebArena ซึ่งทดสอบการนำทางและปฏิบัติการบนเว็บ โมเดลนี้ก็แสดงศักยภาพที่แข็งแกร่ง โดยรวมแล้ว Arcee-Think-405B ถือเป็นโมเดลแบบเปิดที่แข็งแกร่งที่สุดในงานตัวแทนในปัจจุบัน

จุดเด่นสำคัญของโมเดลนี้คือการเปิดเผยโค้ดและน้ำหนักโมเดล (model weights) ภายใต้ใบอนุญาต Apache 2.0 บนแพลตฟอร์ม Hugging Face ทำให้ผู้พัฒนา นักวิจัย และธุรกิจสามารถเข้าถึงและปรับใช้ได้ฟรี โดยไม่ต้องพึ่งพาโมเดลปิดจากผู้ให้บริการรายใหญ่ ซึ่งช่วยลดอุปสรรคในการพัฒนาแอปพลิเคชัน AI สำหรับงานตัวแทน เช่น หุ่นยนต์อัตโนมัติ ระบบช่วยตัดสินใจทางธุรกิจ หรือเครื่องมือวิเคราะห์ข้อมูลเชิงลึก

นอกจาก Arcee-Think-405B แล้ว Arcee AI ยังมีโมเดลอื่น ๆ ในพอร์ตโฟลิโอ เช่น Arcee-Coder-Nyx-72B ซึ่งเป็นโมเดลสำหรับการเขียนโค้ดที่ปรับแต่งจาก Llama 3.1 70B โดยใช้ชุดข้อมูลเดียวกัน ชุดข้อมูล Arcee-Nyx ได้รับการออกแบบให้ครอบคลุมหลากหลายโดเมน ตั้งแต่คณิตศาสตร์ วิทยาศาสตร์ ไปจนถึงการเขียนโปรแกรมและการเหตุผลทั่วไป ทำให้โมเดลทั้งสองมีความยืดหยุ่นสูงในการใช้งานจริง

Simon Pruden ผู้ก่อตั้งและซีอีโอของ Arcee AI กล่าวว่า “การเหตุผล (reasoning) คือหัวใจสำคัญของปัญญาประดิษฐ์ที่แท้จริง โดยเฉพาะในงานตัวแทนที่ต้องการการวางแผนและการปรับตัวแบบไดนามิก เราต้องการสร้างโมเดลที่ไม่เพียงแต่ฉลาด แต่ยังเปิดกว้างเพื่อให้ทุกคนเข้าถึงได้” การตัดสินใจใช้ทุนจำนวนมากในการฝึกโมเดลนี้แสดงให้เห็นถึงวิสัยทัศน์ของบริษัทในการแข่งขันกับยักษ์ใหญ่ด้าน AI อย่าง Anthropic และ OpenAI โดยมุ่งเน้นที่เทคโนโลยีแบบเปิดที่ยั่งยืน

การพัฒนานี้เกิดขึ้นท่ามกลางกระแสการแข่งขันด้านโมเดลเหตุผลที่รุนแรงขึ้น โดย Arcee AI ได้พิสูจน์ว่าการลงทุนในชุดข้อมูลสังเคราะห์คุณภาพสูงและการคำนวณขนาดใหญ่สามารถสร้างโมเดลที่เทียบชั้นโมเดลชั้นนำได้ แม้จะเป็นสตาร์ทอัพขนาดเล็กก็ตาม ผู้เชี่ยวชาญในอุตสาหกรรมมองว่านี่เป็นก้าวสำคัญที่ช่วยขับเคลื่อนระบบนิเวศ AI แบบเปิดให้ก้าวหน้า โดยเฉพาะในด้านงานตัวแทนที่กำลังกลายเป็นแกนกลางของแอปพลิเคชันธุรกิจในอนาคต เช่น การจัดการซัพพลายเชนอัจฉริยะ การบริการลูกค้าอัตโนมัติ และการวิเคราะห์เชิงพยากรณ์

ด้วยประสิทธิภาพที่เหนือกว่าโมเดลแบบเปิดอื่น ๆ และการเข้าถึงที่เปิดกว้าง Arcee-Think-405B จึงกลายเป็นเครื่องมือสำคัญสำหรับนักพัฒนาที่ต้องการสร้างระบบตัวแทน AI ที่มีประสิทธิภาพสูง โดยบริษัท Arcee AI วางแผนที่จะขยายการพัฒนาต่อไป เพื่อยกระดับขีดความสามารถของโมเดลเหล่านี้ให้ดียิ่งขึ้นในอนาคตอันใกล้

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)