Google DeepMind เปิดตัวโมเดล Gemini Robotics เพื่อขับเคลื่อนหุ่นยนต์ Atlas ของ Boston Dynamics สำหรับงานอุตสาหกรรม
Google DeepMind บริษัทปัญญาประดิษฐ์ชั้นนำภายใต้โครงสร้างของ Alphabet ได้ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่สองตัวสำหรับด้านหุ่นยนต์ศาสตร์ โดยชื่อว่า Gemini Robotics On-Device และ Gemini Robotics Core โมเดลเหล่านี้ได้รับการออกแบบมาเพื่อขับเคลื่อนหุ่นยนต์มนุษย์รูปแบบ Atlas รุ่นไฟฟ้าทั้งหมดของ Boston Dynamics ซึ่งจะนำไปประยุกต์ใช้ในงานอุตสาหกรรม โดยทั้งสองบริษัทนี้อยู่ภายใต้การถือครองของ Hyundai Motor Group ทำให้เกิดการผสานรวมเทคโนโลยีที่แข็งแกร่งระหว่างปัญญาประดิษฐ์กับหุ่นยนต์ขั้นสูง
Gemini Robotics On-Device เป็นโมเดลที่ทำงานบนอุปกรณ์ขอบ (edge device) ของหุ่นยนต์โดยตรง ซึ่งช่วยให้สามารถประมวลผลแบบเรียลไทม์ได้อย่างมีประสิทธิภาพ โดยไม่ต้องพึ่งพาการเชื่อมต่ออินเทอร์เน็ตหรือคลาวด์เสมอไป โมเดลนี้มีขนาดกะทัดรัด ใช้พลังงานต่ำ และสามารถจัดการงานควบคุมการเคลื่อนไหว การรับรู้ภาพ และการโต้ตอบกับวัตถุทางกายภาพได้อย่างรวดเร็ว ลดความหน่วง (latency) ลงเหลือระดับมิลลิวินาที ซึ่งจำเป็นอย่างยิ่งสำหรับการทำงานในสภาพแวดล้อมจริงที่ต้องการความแม่นยำสูง เช่น การหยิบจับชิ้นส่วนในโรงงานอุตสาหกรรม
ในทางตรงกันข้าม Gemini Robotics Core เป็นโมเดลขนาดใหญ่ที่ทำงานบนคลาวด์ของ Google ซึ่งเหมาะสำหรับงานที่ซับซ้อน เช่น การวางแผนกลยุทธ์ การตีความบริบท และการแก้ปัญหาที่ต้องการการคิดเชิงนามธรรม โมเดลนี้ใช้ประโยชน์จากพลังการประมวลผลมหาศาลของโครงสร้างพื้นฐาน Tensor Processing Units (TPU) ของ Google เพื่อสร้างแผนการทำงานที่ซับซ้อน โดยสามารถรวมข้อมูลจากเซ็นเซอร์หลายตัวบนหุ่นยนต์ Atlas เช่น กล้องและ LiDAR เพื่อสร้างแผนที่สภาพแวดล้อมแบบ 3 มิติและคาดการณ์การเคลื่อนไหวของวัตถุ
การผสานรวมทั้งสองโมเดลนี้เข้ากับหุ่นยนต์ Atlas ทำให้เกิดระบบหุ่นยนต์ที่สมบูรณ์แบบ โดย Atlas ซึ่งเป็นหุ่นยนต์มนุษย์รูปแบบรุ่นใหม่ที่ใช้ระบบไฮดรอลิกไฟฟ้า (electrified hydraulics) สามารถทำหน้าที่ได้หลากหลายในสภาพแวดล้อมอุตสาหกรรม เช่น การยกของหนัก การประกอบชิ้นส่วน และการจัดการวัสดุในคลังสินค้า วิดีโอตัวอย่างที่เผยแพร่แสดงให้เห็น Atlas กำลังหยิบฝาครอบเครื่องยนต์จากตะกร้า ย้ายไปยังตำแหน่งอื่น และวางลงอย่างแม่นยำ รวมถึงการจัดการวัตถุที่หลากหลายรูปทรงและขนาด โดยอาศัยการมองเห็นด้วยคอมพิวเตอร์ (computer vision) ที่ขับเคลื่อนด้วย Gemini
Sundar Pichai CEO ของ Google และ Alphabet กล่าวว่า “การพัฒนาหุ่นยนต์ที่สามารถทำงานในโลกจริงได้อย่างปลอดภัยและมีประสิทธิภาพเป็นก้าวสำคัญสู่การปฏิวัติอุตสาหกรรมครั้งใหม่ โมเดล Gemini Robotics จะช่วยให้หุ่นยนต์อย่าง Atlas สามารถเรียนรู้และปรับตัวได้เหมือนมนุษย์” ในขณะที่ Ross Atkin หัวหน้าทีมหุ่นยนต์ของ DeepMind เน้นย้ำว่า “เราต้องการสร้างหุ่นยนต์ที่เข้าใจโลกกายภาพได้ลึกซึ้ง โดยใช้ multimodal AI ที่รวมภาษา ภาพ และการกระทำเข้าด้วยกัน ซึ่ง Gemini Robotics On-Device และ Core คือคำตอบสำหรับความท้าทายนี้”
การนำไปใช้งานจริงจะเริ่มต้นในโรงงานของ Hyundai Motor Group ซึ่งเป็นเจ้าของทั้ง DeepMind และ Boston Dynamics โดยมีแผนทดสอบในสภาพแวดล้อมการผลิตจริงเพื่อตรวจสอบความน่าเชื่อถือ ความปลอดภัย และประสิทธิภาพ Atlas จะถูกปรับแต่งให้ทำงานร่วมกับมนุษย์ในสายการผลิต โดยมีระบบความปลอดภัยหลายชั้น เช่น การหยุดอัตโนมัติเมื่อตรวจพบสิ่งกีดขวาง และการเรียนรู้จากข้อมูลจริงเพื่อปรับปรุงตัวเองอย่างต่อเนื่อง
เทคโนโลยีนี้ยึดหลักการพัฒนาที่เรียกว่า “end-to-end learning” โดยโมเดลเรียนรู้ตั้งแต่การรับรู้ภาพไปจนถึงการควบคุมมอเตอร์โดยตรง ลดช่องว่างระหว่างการรับรู้กับการกระทำ ซึ่งเป็นปัญหาหลักของหุ่นยนต์รุ่นก่อนหน้า นอกจากนี้ ยังรองรับการฝึกอบรมด้วยข้อมูลสังเคราะห์ (synthetic data) จำนวนมหาศาล เพื่อเร่งการพัฒนาโดยไม่ต้องเสี่ยงกับอุปกรณ์จริงในระยะแรก
การเปิดตัวนี้เกิดขึ้นท่ามกลางกระแสการแข่งขันด้านหุ่นยนต์มนุษย์รูปแบบที่รุนแรง โดยบริษัทอย่าง Tesla (Optimus), Figure AI และ Agility Robotics กำลังพัฒนาเทคโนโลยีคล้ายคลึงกัน แต่การผสาน Gemini ซึ่งเป็นโมเดล multimodal ที่ทรงพลังที่สุดตัวหนึ่งของ Google กับโครงสร้างหุ่นยนต์ที่แข็งแกร่งของ Atlas ทำให้เกิดข้อได้เปรียบที่ชัดเจน โดยเฉพาะในด้านการจัดการงานอุตสาหกรรมที่ต้องการความยืดหยุ่นสูง
DeepMind ยังได้เผยแพร่ชุดเครื่องมือพัฒนา (developer toolkit) สำหรับ Gemini Robotics เพื่อให้บริษัทอื่นสามารถนำไปประยุกต์ใช้กับหุ่นยนต์ของตนได้ โดยรองรับแพลตฟอร์มฮาร์ดแวร์หลากหลาย ซึ่งจะช่วยเร่งการนำหุ่นยนต์ AI ไปสู่ตลาดเชิงพาณิชย์ในวงกว้าง
ด้วยศักยภาพดังกล่าว คาดว่าการร่วมมือครั้งนี้จะเปลี่ยนโฉมหน้ามาตรฐานการผลิตอุตสาหกรรม โดยหุ่นยนต์ Atlas ที่ขับเคลื่อนด้วย Gemini จะช่วยลดต้นทุนแรงงาน เพิ่มประสิทธิภาพ และจัดการงานที่อันตรายแทนมนุษย์ สร้างโอกาสใหม่ให้กับอุตสาหกรรมยานยนต์และการผลิตทั่วโลก
(จำนวนคำประมาณ 728 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)