จีทีซี 2026: เอ็นวิเดียต้องการเปลี่ยนปัญหาข้อมูลหุ่นยนต์ให้กลายเป็นปัญหาการคำนวณ
ในงานประชุมนักพัฒนา GPU Technology Conference (GTC) ปี 2026 ซีอีโอของเอ็นวิเดีย เจนเซ่น หวัง (Jensen Huang) ได้ประกาศวิสัยทัศน์ใหม่ที่มุ่งแก้ไขอุปสรรคหลักในการพัฒนาหุ่นยนต์มนุษย์รูปแบบ (humanoid robots) โดยเสนอแนวทางที่เปลี่ยน “ปัญหาการขาดแคลนข้อมูล” (data problem) ให้กลายเป็น “ปัญหาการคำนวณ” (compute problem) ซึ่งสามารถแก้ไขได้ด้วยพลังการประมวลผลที่เพิ่มขึ้นอย่างมหาศาล
จุดเปลี่ยนของอุตสาหกรรมหุ่นยนต์
เจนเซ่น หวัง เน้นย้ำว่าอุตสาหกรรมหุ่นยนต์กำลังเข้าสู่จุดเปลี่ยน (inflection point) คล้ายกับการปฏิวัติปัญญาประดิษฐ์ (AI) ในช่วงไม่กี่ปีที่ผ่านมา ปัญหาหลักที่ขัดขวางความก้าวหน้าของหุ่นยนต์มนุษย์รูปแบบคือการขาดข้อมูลฝึกอบรมจำนวนมหาศาล ข้อมูลจริงจากโลกกายภาพมีราคาแพง ใช้เวลานาน และเสี่ยงภัยในการเก็บรวบรวม แตกต่างจาก AI ที่สามารถฝึกด้วยข้อมูลจากอินเทอร์เน็ตได้ง่ายดาย หุ่นยนต์ต้องการข้อมูลที่หลากหลายเพื่อเรียนรู้การเคลื่อนไหว การรับรู้ และปฏิสัมพันธ์กับสภาพแวดล้อมที่ซับซ้อน
เอ็นวิเดียมองว่าการแก้ปัญหานี้ไม่ใช่การเก็บข้อมูลจริงเพิ่ม แต่เป็นการสร้าง “ข้อมูลสังเคราะห์” (synthetic data) ผ่านการจำลอง (simulation) ซึ่งต้องการพลังการคำนวณสูง แต่สามารถผลิตข้อมูลได้ไม่จำกัดและปรับแต่งได้ตามต้องการ แนวคิดนี้เรียกว่า “Project GR00T” ซึ่งเป็นแพลตฟอร์มรากฐานสำหรับโมเดล AI เปิด (open foundation models) ที่ออกแบบมาเพื่อหุ่นยนต์มนุษย์รูปแบบโดยเฉพาะ
Project GR00T: โมเดลรากฐานสำหรับหุ่นยนต์มนุษย์รูปแบบ
Project GR00T ประกอบด้วยองค์ประกอบหลักหลายส่วน โดยเริ่มต้นด้วย GR00T N1 ซึ่งเป็นโมเดลรากฐาน humanoid ตัวแรกที่เปิดให้ใช้งานฟรี GR00T N1 ใช้สถาปัตยกรรม Transformer-based multimodal foundation model ที่รวมข้อมูลจากเซ็นเซอร์หลากหลายประเภท เช่น ภาพจากกล้อง RGB ข้อมูลลึก (depth data) ข้อมูลจากเซ็นเซอร์สัมผัส (tactile sensor data) และข้อมูลโครงสร้างข้อต่อ (proprioceptive state) โมเดลนี้ฝึกด้วยข้อมูลสังเคราะห์จำนวนมหาศาลจาก Isaac Sim ซึ่งเป็นเครื่องมือจำลองฟิสิกส์ขั้นสูงของเอ็นวิเดีย
นอกจากนี้ ยังมี “Isaac GR00T Blueprint” ซึ่งเป็นชุดเครื่องมือและโมเดลสำเร็จรูปที่ช่วยนักพัฒนาหุ่นยนต์สร้างและปรับแต่งโมเดล GR00T ได้อย่างรวดเร็ว Blueprint นี้รวมถึงโมเดลการวางแผนการเคลื่อนไหว (motion planning) การควบคุมการเคลื่อนไหว (motion control) และการรับรู้ภาษา (language understanding) โดยใช้สถาปัตยกรรมที่คล้ายกับโมเดลภาษาขนาดใหญ่ (LLM) แต่ปรับให้เหมาะกับงานหุ่นยนต์
เครือข่ายพันธมิตรและการนำไปใช้จริง
เอ็นวิเดียได้ร่วมมือกับบริษัทชั้นนำในอุตสาหกรรมหุ่นยนต์หลายแห่ง เพื่อเร่งการพัฒนาและนำ GR00T ไปใช้งานจริง พันธมิตรหลัก ได้แก่:
- 1X Technologies: ใช้ GR00T สำหรับหุ่นยนต์ NEO
- Agility Robotics: พัฒนาหุ่นยนต์ Digit
- Apptronik: หุ่นยนต์ Apollo
- Boston Dynamics: หุ่นยนต์ Atlas
- Covariant: แพลตฟอร์ม RFM-1
- Figure AI: หุ่นยนต์ Figure 01
- Fourier Intelligence: หุ่นยนต์ GR-1 และ GR-2
- Sanctuary AI: หุ่นยนต์ Phoenix
- Unitree Robotics: หุ่นยนต์ H1 และ G1
- XPENG Robotics: หุ่นยนต์ Iron
บริษัทเหล่านี้จะใช้ GR00T เป็นจุดเริ่มต้นในการฝึกโมเดลเฉพาะโดเมน (domain-specific models) โดยอาศัยข้อมูลสังเคราะห์จาก Isaac Sim ซึ่งจำลองสภาพแวดล้อมจริงได้อย่างสมจริง รวมถึงฟิสิกส์ การรับแสง และปฏิสัมพันธ์กับวัตถุ
Cosmos: แพลตฟอร์มข้อมูลสำหรับหุ่นยนต์
เพื่อสนับสนุนการแบ่งปันข้อมูล เอ็นวิเดียเปิดตัว “Cosmos” ซึ่งเป็นแพลตฟอร์มคลาวด์ที่รวมชุดข้อมูลหุ่นยนต์ (robotics datasets) จากพันธมิตร Cosmos ช่วยให้นักพัฒนาสามารถดาวน์โหลดข้อมูลจริงและข้อมูลสังเคราะห์เพื่อฝึกโมเดล โดยข้อมูลทั้งหมดอยู่ในรูปแบบมาตรฐานที่เข้ากันได้กับ GR00T ทำให้เกิด “rich-get-richer effect” ที่โมเดลดีขึ้นเรื่อยๆ เมื่อมีข้อมูลมากขึ้น
โครงสร้างพื้นฐานการคำนวณ: RTX PRO Servers
การเปลี่ยนปัญหาข้อมูลเป็นปัญหาการคำนวณต้องอาศัยฮาร์ดแวร์ที่ทรงพลัง เอ็นวิเดียแนะนำ “NVIDIA RTX PRO Servers” ซึ่งเป็นเซิร์ฟเวอร์สำหรับฝึกโมเดลหุ่นยนต์โดยเฉพาะ ใช้ GPU Blackwell และ GPU รุ่นก่อนหน้า สามารถฝึกโมเดลขนาดใหญ่ด้วยข้อมูลหลายพันล้านเฟรมได้ในเวลาอันสั้น ตัวอย่างเช่น RTX PRO Blackwell Server สามารถประมวลผลได้ 40 พีตะฟลอปส์ (petaflops) ใน FP4 precision ซึ่งเหมาะสำหรับการจำลองและฝึกโมเดล GR00T
วิสัยทัศน์อนาคต: ข้อมูลไม่จำกัดผ่านการจำลอง
เจนเซ่น หวัง เปรียบเทียบว่าการจำลองคือ “internet for robotics” ที่ผลิตข้อมูลได้ไม่สิ้นสุด โดย Isaac Sim สามารถจำลองหุ่นยนต์หลายล้านตัวพร้อมกันในสภาพแวดล้อมหลากหลาย ทำให้เกิดข้อมูลคุณภาพสูงที่เทียบเท่าหรือเหนือกว่าข้อมูลจริง แนวทางนี้ไม่เพียงแก้ปัญหาข้อมูล แต่ยังช่วยลดต้นทุนและความเสี่ยงในการพัฒนาหุ่นยนต์
ด้วย Project GR00T, Isaac Sim, Cosmos และ RTX PRO Servers เอ็นวิเดียกำลังสร้างระบบนิเวศที่ทำให้หุ่นยนต์มนุษย์รูปแบบเข้าถึงได้ง่ายขึ้น คาดว่าจะเห็นหุ่นยนต์ที่ฉลาดและใช้งานได้จริงในโรงงาน คลังสินค้า และสภาพแวดล้อมอื่นๆ ภายในไม่กี่ปีข้างหน้า การเปลี่ยนจากปัญหาข้อมูลสู่ปัญหาการคำนวณนี้คือกุญแจสู่การปฏิวัติหุ่นยนต์ครั้งใหญ่
(จำนวนคำประมาณ 750 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)