AI2 เปิดตัวโมเดลปัญญาประดิษฐ์สำหรับหุ่นยนต์รุ่นใหม่ ฝึกฝนทั้งหมดในสภาพแวดล้อมจำลอง เพื่อหลีกเลี่ยงการเก็บข้อมูลจากโลกจริง
สถาบัน Allen Institute for AI (AI2) ได้ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่สำหรับด้านหุ่นยนต์ โดยโมเดลเหล่านี้ได้รับการฝึกฝนอย่างสมบูรณ์ทั้งหมดในสภาพแวดล้อมจำลอง (simulation) โดยไม่ต้องอาศัยข้อมูลจากการเก็บรวบรวมในโลกจริง ซึ่งถือเป็นความก้าวหน้าที่สำคัญในการพัฒนาหุ่นยนต์อัจฉริยะ โมเดลดังกล่าวมีชื่อเรียกว่า RT-2-X ซึ่งเป็นส่วนหนึ่งของความพยายามในการสร้างฐานรากสำหรับหุ่นยนต์ที่สามารถถ่ายโอนความสามารถจากโลกเสมือนไปสู่โลกจริงได้อย่างมีประสิทธิภาพ โดยไม่ต้องเผชิญกับต้นทุนสูงและความยุ่งยากในการเก็บข้อมูลจากหุ่นยนต์จริง
พื้นฐานของโมเดล RT-2-X และวัตถุประสงค์หลัก
RT-2-X เป็นโมเดลประเภท Vision-Language-Action (VLA) ที่ออกแบบมาเพื่อจัดการกับงานหุ่นยนต์ที่หลากหลาย โดยอาศัยข้อมูลการฝึกฝนจากสภาพแวดล้อมจำลองเท่านั้น ปัจจุบัน AI2 ได้เปิดตัวโมเดลตัวอย่างขนาด 55 ล้านพารามิเตอร์ (parameters) และมีแผนจะปล่อยโมเดลขนาดใหญ่กว่าออกมาในเร็วๆ นี้ ได้แก่ขนาด 300 ล้านและ 1 พันล้านพารามิเตอร์ ความแตกต่างหลักจากโมเดลก่อนหน้านี้อย่าง RT-2 คือ RT-2-X ได้รับการฝึกฝนโดยไม่ใช้ข้อมูลจากหุ่นยนต์จริงเลย ซึ่งช่วยลดข้อจำกัดด้านต้นทุน เวลา และความเสี่ยงที่เกี่ยวข้องกับการทดลองในโลกจริง
การฝึกฝนในสภาพแวดล้อมจำลองช่วยให้สามารถสร้างข้อมูลจำนวนมหาศาลได้อย่างรวดเร็ว โดย AI2 ใช้เครื่องมือจำลองชั้นนำ เช่น Isaac Gym และสภาพแวดล้อมอื่นๆ อีกหลายตัว เพื่อสร้างข้อมูล trajectory แบบ multi-task ที่หลากหลาย ครอบคลุมงานต่างๆ เช่น การเคลื่อนที่ การหยิบจับวัตถุ การโต้ตอบกับสิ่งแวดล้อม และการปฏิบัติตามคำสั่งภาษาธรรมชาติ ข้อมูลทั้งหมดนี้มีปริมาณรวมกว่า 22 พันล้านโทเค็น (tokens) ซึ่งเทียบเท่ากับชั่วโมงการฝึกฝนกว่า 200,000 ชั่วโมง
กระบวนการฝึกฝนและข้อมูลที่ใช้
กระบวนการฝึกฝนของ RT-2-X อาศัยข้อมูลจาก 8 สภาพแวดล้อมจำลองที่แตกต่างกัน เพื่อให้โมเดลมีความสามารถในการ generalize หรือการถ่ายโอนความรู้ไปยังสถานการณ์ใหม่ๆ ได้ดี ข้อมูล trajectory เหล่านี้ถูกสร้างขึ้นโดยอัตโนมัติผ่านการสุ่มงานและสถานการณ์ที่หลากหลาย ทำให้โมเดลเรียนรู้พฤติกรรมหุ่นยนต์ที่ซับซ้อน เช่น การหลีกเลี่ยงอุปสรรค การจัดการกับวัตถุที่เปราะบาง และการตอบสนองต่อคำสั่งที่ไม่เคยพบมาก่อน
จุดเด่นคือการใช้เทคนิคการฝึกฝนแบบ end-to-end โดยโมเดลรับข้อมูลภาพ (vision) และคำสั่งภาษา (language) แล้วส่งออกคำสั่งการกระทำ (action) โดยตรง โดยไม่ต้องแยกส่วนย่อย ทำให้มีประสิทธิภาพสูงในการจัดการงานที่ต้องการการรวมข้อมูลหลายรูปแบบ นอกจากนี้ AI2 ยังใช้ข้อมูลจากโครงการ Open X-Embodiment ซึ่งเป็นชุดข้อมูลเปิดที่รวบรวมจากแหล่งต่างๆ เพื่อเสริมสร้างความแข็งแกร่งให้กับโมเดล แม้จะไม่ใช้ข้อมูลหุ่นยนต์จริงในการฝึกฝนหลัก แต่การประเมินผลจะทำบนหุ่นยนต์จริงเพื่อยืนยันประสิทธิภาพ
ผลการทดสอบและประสิทธิภาพบนหุ่นยนต์จริง
เพื่อยืนยันความสามารถ RT-2-X ได้รับการทดสอบในโหมด zero-shot หรือการใช้งานโดยไม่มีการฝึกฝนเพิ่มเติม บนหุ่นยนต์จริง 7 ตัวจากผู้ผลิตต่างๆ เช่น RT-2 robot และโมเดลอื่นๆ ผลการทดสอบแสดงให้เห็นอัตราความสำเร็จที่สูงมาก เช่น
- งาน Language Table: อัตราความสำเร็จ 93% ซึ่งเทียบเท่าหรือดีกว่า RT-2 ที่ฝึกด้วยข้อมูลจริง
- งาน Adroit: อัตราความสำเร็จ 85%
- งาน CALVIN: อัตราความสำเร็จ 78%
- งาน Bridge-v2: อัตราความสำเร็จ 60%
ประสิทธิภาพเหล่านี้ถือเป็น state-of-the-art (SOTA) สำหรับโมเดลที่ฝึกใน simulation เท่านั้น โดยเฉพาะอย่างยิ่งในด้าน zero-shot transfer ที่โมเดลสามารถจัดการกับหุ่นยนต์และงานที่ไม่เคยเห็นมาก่อนได้ดี แสดงให้เห็นถึงความสามารถในการ generalize ที่เหนือชั้น นอกจากนี้ โมเดลยังแสดงพฤติกรรมที่ปลอดภัยและมีเหตุผล เช่น การหยุดชะงักเมื่อพบสถานการณ์ที่ไม่คุ้นเคย หรือการปฏิบัติตามคำสั่งที่ซับซ้อน เช่น “หยิบแอปเปิ้ลแล้ววางลงในตะกร้าโดยไม่ทำหล่น”
ความสำคัญทางธุรกิจและการเปิดกว้างของโมเดล
การพัฒนา RT-2-X ถือเป็นก้าวสำคัญสำหรับอุตสาหกรรมหุ่นยนต์ เนื่องจากช่วยลดอุปสรรคในการเข้าถึงเทคโนโลยี โดยบริษัทต่างๆ สามารถดาวน์โหลดโมเดลและปรับใช้ได้ทันทีโดยไม่ต้องลงทุนมหาศาลในการเก็บข้อมูลจริง ซึ่งมักใช้เวลานานและมีค่าใช้จ่ายสูง AI2 ได้เปิดโมเดลทั้งหมดแบบ open-source บน GitHub รวมถึงโค้ดการฝึกฝน สคริปต์การประเมิน และน้ำหนักโมเดล เพื่อส่งเสริมการวิจัยและการพัฒนาในชุมชน นอกจากนี้ ยังมีแผนขยายสเกลข้อมูลและขนาดโมเดลในอนาคต เพื่อยกระดับประสิทธิภาพให้สูงขึ้น
โครงการนี้สอดคล้องกับวิสัยทัศน์ของ AI2 ในการสร้าง AI ที่เป็นประโยชน์ต่อมนุษยชาติ โดยเน้น openness และ reproducibility ซึ่งช่วยให้ผู้ประกอบการ นักวิจัย และวิศวกรสามารถนำไปประยุกต์ใช้ในอุตสาหกรรมต่างๆ เช่น การผลิต การโลจิสติกส์ การดูแลสุขภาพ และบริการ โดยไม่ต้องเริ่มต้นจากศูนย์
สรุปประโยชน์และแนวโน้มอนาคต
RT-2-X ไม่เพียงแต่พิสูจน์ว่าการฝึกฝนใน simulation สามารถให้ผลลัพธ์ที่เทียบเท่ากับข้อมูลจริง แต่ยังเปิดประตูสู่การพัฒนาหุ่นยนต์ที่ scalable มากขึ้น ในยุคที่หุ่นยนต์ต้องทำงานในสภาพแวดล้อมที่ซับซ้อนและหลากหลาย ความสามารถในการ zero-shot จาก simulation ไป real-world จะเป็นปัจจัยกำหนดความสำเร็จทางธุรกิจ AI2 เชื่อมั่นว่านวัตกรรมนี้จะเร่งการนำหุ่นยนต์ AI ไปสู่การใช้งานจริง โดยผู้สนใจสามารถเข้าถึงได้ฟรีเพื่อทดลองและพัฒนาต่อ
(จำนวนคำประมาณ 728 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)