จีนกำลังตามหลังในการแข่งขันด้านปัญญาประดิษฐ์ ตามเกณฑ์ประเมินของรัฐบาลสหรัฐฯ
รัฐบาลสหรัฐฯ ได้เผยแพร่เกณฑ์ประเมินใหม่สำหรับโมเดลปัญญาประดิษฐ์ชั้นนำ (frontier AI models) ซึ่งชี้ให้เห็นว่าจีนกำลังตามหลังสหรัฐฯ อย่างชัดเจนในการแข่งขันด้านเอไอ แม้จีนจะลงทุนมหาศาลในเทคโนโลยีนี้ก็ตาม เกณฑ์ดังกล่าวซึ่งพัฒนาโดยสถาบันความปลอดภัยด้านเอไอของสหรัฐฯ (US AI Safety Institute หรือ AISI) ภายใต้กระทรวงพาณิชย์สหรัฐฯ ได้ทดสอบโมเดลเอไอจากทั้งสองฝ่ายในด้านความสามารถขั้นสูง เช่น การแก้ปัญหาคณิตศาสตร์ระดับมัธยมปลาย การตอบคำถามวิทยาศาสตร์ระดับดุษฎีบัณฑิต และการใช้เหตุผลทั่วไป
เกณฑ์ประเมินนี้ใช้ชุดข้อมูลทดสอบที่เข้มงวด โดยมุ่งเน้นที่ความสามารถของโมเดลเอไอในการจัดการงานที่มนุษย์หายาก (human-hard tasks) ซึ่งรวมถึง ARC-AGI (คะแนนเฉลี่ย 5.1% สำหรับโมเดลชั้นนำ) GPQA Diamond (คะแนนเฉลี่ย 41.4%) AIME 2024 (คะแนนเฉลี่ย 11.5%) และ Humanity’s Last Exam (คะแนนเฉลี่ย 9.1%) โมเดลจากสหรัฐฯ อย่าง OpenAI o1-preview, GPT-4o, Anthropic Claude 3.5 Sonnet และ Google Gemini 1.5 Pro ได้รับคะแนนสูงสุดในทุกหมวด โดย o1-preview ทำคะแนนนำโด่งใน ARC-AGI ที่ 5.9% และ GPQA ที่ 59.4%
ในทางตรงกันข้าม โมเดลเอไอจากจีน เช่น Qwen2.5-72B-Instruct จาก Alibaba DeepSeek-V2 Chat จาก DeepSeek Yi-1.5-34B-Chat-16K จาก 01.AI และ GLM-4-9B-Chat จาก Zhipu AI ได้รับคะแนนต่ำกว่าอย่างมีนัยสำคัญ Qwen2.5-72B-Instruct ทำคะแนนสูงสุดในกลุ่มจีนที่ GPQA 37.6% แต่ยังตามหลัง Claude 3.5 Sonnet ซึ่งทำได้ 59.4% ใน AIME 2024 โมเดลจีนส่วนใหญ่ทำคะแนนได้ต่ำกว่า 10% ขณะที่โมเดลสหรัฐฯ ทำได้สูงถึง 13.6% ในบางกรณี
การทดสอบนี้ดำเนินการโดยใช้เครื่องมือ SEAL (Safety, Evaluations, and Alignment Lab) ของ AISI ซึ่งประเมินโมเดลเอไอ 17 โมเดลจากผู้พัฒนา 8 ราย โดยครอบคลุมโมเดลเปิด (open-weight) และโมเดลปิด (closed-weight) ผลลัพธ์แสดงให้เห็นช่องว่างที่กว้างขวาง โดยโมเดลสหรัฐฯ มีค่าเฉลี่ยรวมสูงกว่าจีนถึงสองเท่าในบางเมตริก นอกจากนี้ ยังมีการทดสอบด้านความปลอดภัย เช่น การหลีกเลี่ยงการสร้างอาวุธชีวภาพ (biosecurity) และการตอบสนองต่อคำสั่งอันตราย ซึ่งโมเดลสหรัฐฯ ก็ทำได้ดีกว่า
รายงานของ AISI เน้นย้ำว่าการพัฒนาเอไอชั้นนำมีความสำคัญต่อความมั่นคงแห่งชาติของสหรัฐฯ และเป็นพื้นฐานสำหรับนโยบายการส่งออกชิปและเทคโนโลยีเอไอ รัฐบาลสหรัฐฯ กำลังใช้ผลการทดสอบนี้เพื่อปรับปรุงกฎระเบียบการส่งออก โดยมุ่งจำกัดการเข้าถึงเทคโนโลยีขั้นสูงของจีน ซึ่งสอดคล้องกับมาตรการควบคุมการส่งออกชิปเอไเอ็นพี (AI chips) ตั้งแต่ปี 2566 ที่ผ่านมา
แม้จีนจะมีโมเดลเอไโอจำนวนมากและเปิดเผยโมเดลน้ำหนักเปิดเพื่อเร่งพัฒนา แต่ผลการทดสอบชี้ว่ายังไม่สามารถแซงหน้าสหรัฐฯ ได้ นักวิเคราะห์มองว่าปัจจัยหลักมาจากข้อจำกัดด้านฮาร์ดแวร์ โดยจีนพึ่งพาชิป Nvidia H100 และ H20 ซึ่งถูกควบคุมการส่งออก ทำให้ต้องใช้ทรัพยากรคอมพิวติ้งน้อยลง ส่งผลต่อคุณภาพการฝึกโมเดล นอกจากนี้ การขาดแคลนบุคลากรชั้นนำและข้อมูลฝึกคุณภาพสูงก็เป็นอุปสรรคสำคัญ
ตัวอย่างเช่น DeepSeek-V2 ซึ่งเป็นโมเดลเปิดขนาดใหญ่ ทำคะแนน GPQA ได้ 37.5% และ AIME 6.5% ซึ่งถือว่าดีในกลุ่มจีน แต่ยังห่างไกลจาก o1-preview ที่ 59.4% และ 13.6% ตามลำดับ Qwen2.5 ซึ่งเพิ่งเปิดตัว ได้รับการยกย่องในด้านประสิทธิภาพ แต่คะแนนรวมยังไม่ถึงมาตรฐานสหรัฐฯ
ผลกระทบต่ออุตสาหกรรมเอไอระดับโลกชัดเจน โดยสหรัฐฯ ครองส่วนแบ่งตลาดโมเดลชั้นนำเกือบทั้งหมด ขณะที่จีนมุ่งเน้นโมเดลขนาดกลางและการใช้งานเชิงพาณิชย์ รายงานนี้ยังกระตุ้นให้ผู้พัฒนาเอไอทั่วโลกเข้าร่วมการทดสอบของ AISI เพื่อสร้างมาตรฐานสากลด้านความปลอดภัยและประสิทธิภาพ
ในบริบททางธุรกิจ การตามหลังของจีนอาจส่งผลต่อห่วงโซ่อุปทานเซมิคอนดักเตอร์ โดยบริษัทอย่าง TSMC และ Samsung ต้องปรับตัวตามนโยบายสหรัฐฯ ขณะที่บริษัทจีนอย่าง Huawei และ Baidu พยายามพัฒนาชิปเอไอในประเทศ เช่น Ascend series แต่ยังไม่สามารถแข่งขันได้เต็มที่
AISI วางแผนขยายเกณฑ์ประเมินในอนาคต โดยเพิ่มเมตริกด้านความสามารถทางทหารและเศรษฐกิจ เพื่อติดตามพัฒนาการของเอไอชั้นนำอย่างต่อเนื่อง ผลลัพธ์นี้ไม่เพียงยืนยันความเป็นผู้นำของสหรัฐฯ แต่ยังเป็นเครื่องมือสำคัญในการกำหนดทิศทางนโยบายการค้าทั่วโลก
(จำนวนคำประมาณ 720 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)