DeepSeek ใช้ชิป Nvidia ลักลอบนำเข้าหลายพันชิ้นฝึก AI ตามรายงาน

DeepSeek ถูกกล่าวหาว่าใช้ชิป Nvidia ที่ลักลอบนำเข้าหลายพันตัวในการฝึกโมเดล AI

บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ (AI) จากจีนอย่าง DeepSeek กำลังถูกกล่าวอ้างจากรายงานของ Financial Times (FT) ว่าสามารถเข้าถึงชิป Nvidia ขั้นสูงหลายพันตัว ซึ่งถูกนำเข้าอย่างผิดกฎหมาย แม้สหรัฐอเมริกาจะออกมาตรการห้ามส่งออกชิปเหล่านี้ไปยังจีนเพื่อป้องกันการนำไปใช้ในด้านการทหาร โดย DeepSeek ซึ่งเป็นที่รู้จักจากโมเดลภาษาเปิด (open-source) อย่าง DeepSeek-V2 ได้สร้างศูนย์ข้อมูลขนาดยักษ์เพื่อฝึกโมเดล AI โดยใช้ชิป Nvidia H100 หรือเทียบเท่า ราว 10,000 ตัว

ตามข้อมูลจาก FT ซึ่งอ้างอิงบุคคลใกล้ชิดกับเรื่องนี้ DeepSeek ได้รับชิปเหล่านี้ผ่านเส้นทางการลักลอบนำเข้าจากสิงคโปร์ ไต้หวัน และมาเลเซีย ซึ่งเป็นเส้นทางหลักที่ใช้หลีกเลี่ยงการควบคุมการส่งออกของสหรัฐฯ ชิป Nvidia H100 และ A100 ถือเป็นชิป GPU (Graphics Processing Unit) ที่ทรงพลังที่สุดสำหรับการฝึกโมเดล AI ขนาดใหญ่ แต่ตั้งแต่ปี 2565 สหรัฐฯ ได้ห้ามส่งออกชิปเหล่านี้ไปยังจีน โดย Nvidia ได้พัฒนาชิปเวอร์ชันที่ปรับปรุงให้สอดคล้องกับกฎระเบียบ เช่น A800 และ H800 ซึ่งมีประสิทธิภาพลดลงเพื่อจำกัดการใช้งานด้านการทหาร

อย่างไรก็ตาม รายงานระบุว่า DeepSeek ไม่ได้ใช้ชิปเวอร์ชันที่ถูกกฎหมายเท่านั้น แต่ยังรวมถึงชิป H100 จริงที่ถูกลักลอบนำเข้า โดยราคาชิป H100 ในตลาดมืดของจีนอยู่ที่ประมาณ 35,000-40,000 ดอลลาร์สหรัฐต่อตัว ซึ่งถูกกว่าราคาตลาดปกติในสหรัฐฯ ที่ราว 30,000 ดอลลาร์ แต่ยังแพงกว่าชิป H800 ที่ราคาประมาณ 20,000-25,000 ดอลลาร์ การลักลอบนำเข้าชิปเหล่านี้เกิดขึ้นผ่านเครือข่ายนายหน้าที่ซับซ้อน โดยชิปจะถูกส่งออกจากสหรัฐฯ ไปยังประเทศที่สามก่อน แล้วจึงถูกนำไปยังจีน

DeepSeek ก่อตั้งโดยหลียงเหวินเฟิง (Liang Wenfeng) อดีตผู้ก่อตั้งและผู้จัดการกองทุนเฮดจ์ฟันด์ High-Flyer Capital Management ซึ่งมีสินทรัพย์ภายใต้การบริหารกว่า 1 พันล้านดอลลาร์สหรัฐ บริษัทนี้เน้นการพัฒนาโมเดลภาษาขนาดใหญ่ (large language models) ด้วยต้นทุนต่ำ โดย DeepSeek-V2 ซึ่งมีพารามิเตอร์ 236 พันล้านตัว สามารถฝึกได้ด้วยต้นทุนเพียง 2.788 ล้านดอลลาร์สหรัฐ ใช้เวลาไม่ถึง 2 เดือน และใช้ชิป Nvidia H800 เพียง 2.8 ล้านตัวชั่วโมง (GPU hours) ซึ่งถือว่าประหยัดกว่าคู่แข่งอย่างโมเดล Llama 3 ของ Meta หรือ Qwen ของ Alibaba

ศูนย์ข้อมูลของ DeepSeek ในเมืองเหอเฟย มณฑลอานฮุย มีกำลังการประมวลผลรวมกว่า 50,000 ชิป H800 และกำลังขยายเพิ่ม โดยรายงานจาก FT ระบุว่าบริษัทนี้มีชิป H100 เทียบเท่า 10,000 ตัว ซึ่งช่วยให้สามารถแข่งขันกับยักษ์ใหญ่ด้าน AI อย่าง OpenAI หรือ Google ได้ แม้จะเผชิญข้อจำกัดจากมาตรการควบคุมการส่งออกของสหรัฐฯ ที่เข้มงวดยิ่งขึ้นในเดือนตุลาคม 2566 โดยห้ามส่งออกชิป H800 ด้วย

ปัญหาการลักลอบนำเข้าชิป Nvidia ไม่ใช่เรื่องใหม่ โดยก่อนหน้านี้มีรายงานว่าบริษัทจีนหลายแห่ง เช่น Tencent และ ByteDance ได้รับชิป H100 ผ่านเส้นทางคล้ายกัน สหรัฐฯ พยายามปิดช่องโหว่โดยเพิ่มการตรวจสอบการส่งออกไปยังประเทศที่สาม แต่ตามข้อมูลจาก SemiAnalysis ชิป Nvidia ราว 60-70% ที่ส่งไปยังสิงคโปร์ ไต้หวัน และมาเลเซีย ถูกนำไปยังจีนในที่สุด การกระทำนี้ไม่เพียงละเมิดกฎหมายสหรัฐฯ แต่ยังเสี่ยงต่อการถูกปรับหรือดำเนินคดีจากหน่วยงานอย่าง Bureau of Industry and Security (BIS)

DeepSeek ปฏิเสธที่จะแสดงความคิดเห็นต่อรายงานของ FT แต่บริษัทนี้ยังคงเดินหน้าพัฒนาโมเดล AI อย่างต่อเนื่อง โดยล่าสุดได้เปิดตัว DeepSeek-V3 ซึ่งมีประสิทธิภาพเทียบเท่าโมเดลชั้นนำระดับโลก การเข้าถึงชิปขั้นสูงเหล่านี้ช่วยให้ DeepSeek สามารถรักษาความได้เปรียบในการแข่งขัน AI ของจีน ท่ามกลางสงครามการค้าที่รุนแรงระหว่างสหรัฐฯ และจีน

นอกจากนี้ รายงานยังชี้ให้เห็นถึงความท้าทายในการควบคุมเทคโนโลยี AI โดยสหรัฐฯ ต้องเผชิญกับปัญหาการบังคับใช้กฎระเบียบที่ยากลำบาก เนื่องจากอุปกรณ์เหล่านี้มีขนาดเล็กและซ่อนง่าย ขณะที่ Nvidia เองก็ยังคงทำกำไรจากยอดขายชิปเวอร์ชันที่สอดคล้องกับกฎระเบียบในจีน ซึ่งคิดเป็นสัดส่วนกว่า 20% ของรายได้รวมในไตรมาสล่าสุด

การพัฒนาของ DeepSeek สะท้อนถึงกลยุทธ์ของจีนในการพึ่งพาเทคโนโลยีจากต่างชาติควบคู่กับนวัตกรรมภายในประเทศ โดยบริษัทนี้มุ่งเน้นประสิทธิภาพในการฝึกโมเดลเพื่อลดต้นทุน ซึ่งอาจเปลี่ยนแปลงสมดุลอำนาจในอุตสาหกรรม AI โลกในอนาคตอันใกล้

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)