DeepSeek v4 คาดว่าจะรันทั้งหมดบนชิป Huawei ถือเป็นชัยชนะครั้งใหญ่สำหรับการผลักดันความเป็นอิสระด้าน AI ของจีน

DeepSeek V4 คาดว่าจะทำงานบนชิป Huawei โดยสมบูรณ์ ถือเป็นชัยชนะสำคัญของจีนในการผลักดันความเป็นอิสระด้าน AI

DeepSeek บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ (AI) จากจีน กำลังเตรียมปล่อยโมเดล DeepSeek V4 ซึ่งคาดว่าจะทำงานได้อย่างสมบูรณ์บนชิปของ Huawei โดยไม่ต้องพึ่งพาการ์ดจอ Nvidia ของสหรัฐอเมริกา ถือเป็นก้าวสำคัญที่ช่วยเสริมสร้างความเป็นอิสระทางเทคโนโลยี AI ของจีน ท่ามกลางมาตรการคว่ำบาตรจากสหรัฐฯ

ตามรายงานจากสื่อจีนชื่อดังอย่าง 36Kr แหล่งข่าวที่ใกล้ชิดกับ DeepSeek ระบุว่า โมเดลรุ่นใหม่นี้จะถูกปรับแต่งให้ทำงานบนชิป Ascend ของ Huawei อย่างเต็มรูปแบบ โดยไม่จำเป็นต้องใช้ฮาร์ดแวร์จาก Nvidia ซึ่งเป็นอุปสรรคหลักสำหรับบริษัทเทคโนโลยีจีนในช่วงหลายปีที่ผ่านมา มาตรการคว่ำบาตรของสหรัฐฯ ได้จำกัดการเข้าถึงชิปประสิทธิภาพสูงของ Nvidia ส่งผลให้บริษัทจีนต้องหาทางเลือกในประเทศเพื่อพัฒนา AI ต่อไป

DeepSeek ได้รับความสนใจอย่างมากในวงการ AI ทั่วโลก หลังจากปล่อยโมเดล DeepSeek V3 เมื่อไม่นานมานี้ ซึ่งแสดงศักยภาพในการทำงานบนฮาร์ดแวร์ Huawei ได้อย่างมีประสิทธิภาพ โดยเฉพาะชิป Ascend 910B ที่ Huawei พัฒนาขึ้นเพื่อทดแทน Nvidia A100 โมเดล V3 นี้สามารถแข่งขันกับโมเดลชั้นนำจากตะวันตก เช่น GPT-4o ของ OpenAI และ Claude 3.5 Sonnet ของ Anthropic ในด้านประสิทธิภาพและต้นทุนที่ต่ำกว่า

การที่ DeepSeek V4 จะทำงานบนชิป Huawei 100% ถือเป็นหลักฐานสำคัญของความก้าวหน้าด้านเซมิคอนดักเตอร์ของจีน ชิป Ascend series โดยเฉพาะรุ่น 910C ที่เพิ่งเปิดตัว ได้รับการปรับปรุงให้มีประสิทธิภาพสูงขึ้น รองรับการฝึกโมเดลขนาดใหญ่ได้ดี โดย DeepSeek V3 ถูกฝึกด้วยพารามิเตอร์ถึง 671 พันล้านตัว และ V4 คาดว่าจะมีขนาดใหญ่ยิ่งขึ้น สามารถประมวลผลภาษาจีนและภาษาอังกฤษได้อย่างยอดเยี่ยม

พื้นหลังของ DeepSeek และกลยุทธ์ความเป็นอิสระของจีน

DeepSeek ก่อตั้งโดยทีมนักวิจัยจากจีน มีฐานที่มั่นในปักกิ่ง บริษัทนี้เน้นพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์ส ซึ่งช่วยให้ชุมชนนักพัฒนาทั่วโลกเข้าถึงได้ง่าย โมเดลก่อนหน้านี้ เช่น DeepSeek V2 และ V3 ได้รับการยกย่องว่ามีประสิทธิภาพสูงแต่ใช้ทรัพยากรน้อย โดย V2 ใช้พารามิเตอร์ 236 พันล้านตัวแต่ทำงานได้ใกล้เคียงกับโมเดลขนาดใหญ่กว่า

กลยุทธ์ของจีนในการผลักดันความเป็นอิสระด้าน AI มาจากความจำเป็น ท่ามกลางสงครามการค้าสหรัฐ-จีน สหรัฐฯ ได้ออกมาตรการห้ามส่งออกชิปขั้นสูงไปยังจีนตั้งแต่ปี 2022 ทำให้ Huawei และบริษัทอื่นๆ ต้องเร่งพัฒนาเทคโนโลยีในประเทศ Huawei เองประสบความสำเร็จในการผลิตชิป 7 นาโนเมตรด้วยกระบวนการ SMIC แม้จะด้อยกว่า TSMC ของไต้หวัน แต่ก็เพียงพอสำหรับการใช้งาน AI ในระดับสูง

การผสานรวมระหว่าง DeepSeek และ Huawei แสดงให้เห็นถึง ecosystem ที่สมบูรณ์แบบ ชิป Ascend รองรับเฟรมเวิร์ก CANN (Compute Architecture for Neural Networks) ซึ่งคล้ายกับ CUDA ของ Nvidia ทำให้การพอร์ตโมเดล AI ทำได้ง่าย นอกจากนี้ MindSpore เฟรมเวิร์กโอเพ่นซอร์สของ Huawei ยังช่วยเพิ่มประสิทธิภาพในการฝึกและอนุมานโมเดล

ความสำคัญทางยุทธศาสตร์และผลกระทบ

ชัยชนะนี้ไม่เพียงแต่ช่วย DeepSeek แต่ยังเป็นสัญญาณบวกสำหรับอุตสาหกรรม AI จีนทั้งระบบ บริษัทอย่าง Baidu, Alibaba และ Tencent กำลังเผชิญปัญหาคล้ายกัน แต่ DeepSeek ได้พิสูจน์แล้วว่าสามารถแข่งขันในระดับโลกได้ โดยโมเดล V3 ขึ้นชาร์ต Hugging Face และ LMSYS Arena ทันทีหลังปล่อย

ในแง่เศรษฐกิจ การลดการพึ่งพา Nvidia จะช่วยประหยัดค่าใช้จ่ายมหาศาล ชิป Huawei ราคาถูกกว่าหลายเท่า และช่วยลดความเสี่ยงจากความผันผวนทางการเมือง นอกจากนี้ ยังส่งเสริมการพัฒนาแอปพลิเคชัน AI ในภาษาจีน ซึ่งเป็นตลาดใหญ่ที่สุดในโลก

อย่างไรก็ตาม ผู้เชี่ยวชาญบางรายชี้ว่า ชิป Huawei ยังมีข้อจำกัดด้านประสิทธิภาพเมื่อเทียบกับ Nvidia Blackwell ล่าสุด แต่ DeepSeek ได้ชดเชยด้วยการ优化โมเดลให้มีประสิทธิภาพสูงสุด เช่น การใช้ Mixture-of-Experts (MoE) architecture ที่เปิดใช้งานเฉพาะส่วนที่จำเป็น

มุมมองอนาคต

DeepSeek V4 คาดว่าจะเปิดตัวในช่วงปลายปีนี้ โดยจะเน้นการปรับปรุงด้าน reasoning, coding และ multimodal capabilities การทำงานบน Huawei chips จะช่วยให้ DeepSeek ขยายฐานผู้ใช้ในจีนและประเทศที่เป็นพันธมิตร เช่น รัสเซียและตะวันออกกลาง สุดท้ายแล้ว การพัฒนานี้ย้ำถึงความมุ่งมั่นของจีนในการสร้าง “AI สำหรับทุกคน” ที่ไม่ถูกครอบงำโดยเทคโนโลยีตะวันตก

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)