Meta วางแผนเปิดโอเพนซอร์สส่วนหนึ่งของโมเดล AI ใหม่

เมตาแพลตฟอร์มส์ เตรียมเปิดซอร์สโค้ดส่วนประกอบบางส่วนของโมเดลปัญญาประดิษฐ์รุ่นใหม่

เมตาแพลตฟอร์มส์ อิงค์ (Meta Platforms Inc.) บริษัทเทคโนโลยีชั้นนำของสหรัฐอเมริกา ได้ประกาศแผนการเปิดเผยซอร์สโค้ดส่วนหนึ่งของโมเดลปัญญาประดิษฐ์ (AI) รุ่นใหม่ ซึ่งเป็นส่วนหนึ่งของกลยุทธ์ในการแข่งขันด้านการพัฒนา AI อย่างเข้มข้น Yann LeCun หัวหน้าฝ่ายวิจัย AI ของเมตา ได้โพสต์ข้อความบนแพลตฟอร์ม X (เดิมชื่อ Twitter) เมื่อเร็วๆ นี้ โดยระบุว่า เมตาจะดำเนินการเปิดซอร์สโมเดลดังกล่าวต่อไป โดยเฉพาะโมเดล Llama 4 ซึ่งจะเปิดเผยน้ำหนักโมเดล (model weights) โค้ดสำหรับการอนุมาน (inference code) และโค้ดสำหรับการฝึกอบรม (training code) อย่างไรก็ตาม ข้อมูลสำหรับการฝึกอบรม (training data) และโครงสร้างพื้นฐานสำหรับการฝึกอบรม (training infrastructure) จะไม่ถูกเปิดเผย

การประกาศดังกล่าวสอดคล้องกับแนวทางการพัฒนา AI แบบเปิดของเมตาที่ผ่านมา ซึ่งเริ่มต้นตั้งแต่การเปิดตัวโมเดล Llama รุ่นแรกในปี 2023 โมเดล Llama ได้รับการตอบรับอย่างกว้างขวางจากชุมชนนักพัฒนาและนักวิจัย เนื่องจากเป็นโมเดลขนาดใหญ่ที่มีประสิทธิภาพสูง สามารถใช้งานได้หลากหลาย ตั้งแต่การแปลภาษา การสรุปเนื้อหา ไปจนถึงการสร้างภาพและวิดีโอ โดยเมตาได้เปิดซอร์สโมเดล Llama 1, Llama 2 และ Llama 3 ภายใต้ใบอนุญาตแบบ permissive ซึ่งอนุญาตให้ผู้ใช้งานดัดแปลงและนำไปใช้ในเชิงพาณิชย์ได้ โดยมีข้อจำกัดบางประการ เช่น ห้ามใช้งานในด้านอาวุธหรือการละเมิดความเป็นส่วนตัว

Yann LeCun เน้นย้ำในโพสต์ของตนว่า การเปิดซอร์สส่วนประกอบเหล่านี้จะช่วยให้ชุมชนนักวิจัยทั่วโลกสามารถเข้าถึงและพัฒนาโมเดล AI ได้อย่างรวดเร็วขึ้น ส่งผลให้เกิดนวัตกรรมใหม่ๆ ในอุตสาหกรรม AI การตัดสินใจนี้เกิดขึ้นท่ามกลางการแข่งขันที่ดุเดือดกับบริษัทเทคโนโลยีอื่นๆ เช่น OpenAI ซึ่งพัฒนาโมเดล GPT-4o และ o1 ในลักษณะปิด (closed-source) โดยไม่เปิดเผยรายละเอียดทางเทคนิค ทำให้เมตาเลือกใช้วิธีการเปิดบางส่วนเพื่อรักษาความได้เปรียบในการแข่งขัน ขณะเดียวกันก็ส่งเสริมการพัฒนาแบบเปิดให้กับระบบนิเวศ AI

ในอดีต เมตาได้พิสูจน์ความสำเร็จของกลยุทธ์นี้แล้ว โมเดล Llama 3.1 405B ซึ่งเป็นโมเดลขนาดใหญ่ที่สุดที่เปิดซอร์สในปัจจุบัน มีพารามิเตอร์ถึง 405 พันล้านตัว และแสดงประสิทธิภาพเทียบเท่าโมเดลปิดชั้นนำ เช่น GPT-4o และ Claude 3.5 Sonnet ตามการทดสอบบนบ enchmarks มาตรฐาน เช่น MMLU และ HumanEval นอกจากนี้ เมตายังได้พัฒนาเครื่องมือสนับสนุน เช่น Llama Guard สำหรับการป้องกันเนื้อหาที่ไม่เหมาะสม และ Code Llama สำหรับการเขียนโค้ด ซึ่งทั้งหมดถูกเปิดซอร์สเพื่อให้ผู้พัฒนาสามารถนำไปปรับใช้ในแอปพลิเคชันทางธุรกิจได้

การไม่เปิดเผย training data และ training infrastructure นั้น มีเหตุผลเชิงกลยุทธ์ที่ชัดเจน ข้อมูลฝึกอบรมของเมตา ซึ่งมีขนาดมหาศาล มาจากแหล่งข้อมูลหลากหลาย เช่น โพสต์บน Facebook, Instagram, WhatsApp และเนื้อหาจากพันธมิตร ซึ่งหากเปิดเผยอาจนำไปสู่ปัญหาด้านลิขสิทธิ์และความเป็นส่วนตัว นอกจากนี้ โครงสร้างพื้นฐานสำหรับการฝึกอบรม เช่น ระบบคลัสเตอร์ GPU ขนาดใหญ่ของเมตา ซึ่งใช้พลังงานและทรัพยากรจำนวนมาก ก็เป็นจุดแข็งที่ช่วยให้เมตานำหน้าคู่แข่ง การเก็บส่วนนี้ไว้เป็นความลับจึงช่วยรักษาความเป็นผู้นำในด้านการスケลได้

ผลกระทบต่ออุตสาหกรรม AI จากการเคลื่อนไหวนี้น่าจะมีนัยสำคัญ ชุมชน open-source เช่น Hugging Face ได้รับประโยชน์โดยตรง เนื่องจากสามารถโฮสต์และแจกจ่ายโมเดล Llama ได้อย่างถูกกฎหมาย ส่งผลให้เกิดการพัฒนาแอปพลิเคชันใหม่ๆ เช่น แชทบอทสำหรับธุรกิจ การวิเคราะห์ข้อมูลลูกค้า และระบบแนะนำสินค้า นักวิเคราะห์จากบริษัทวิจัยอย่าง Gartner และ Forrester คาดการณ์ว่า โมเดล open-source จะครองส่วนแบ่งตลาด AI มากขึ้นในปี 2025 โดยเฉพาะในกลุ่มองค์กรขนาดกลางและขนาดย่อมที่ไม่สามารถจ่ายค่าบริการโมเดลปิดได้

เมตายังได้ขยายการใช้งานโมเดล Llama ในผลิตภัณฑ์ของตนเอง เช่น Meta AI บน WhatsApp และ Instagram ซึ่งช่วยเพิ่มฐานผู้ใช้งานให้กับโมเดล open-source การประกาศล่าสุดนี้จึงไม่เพียงแต่เป็นการส่งสัญญาณถึงความมุ่งมั่นใน open-source เท่านั้น แต่ยังเป็นกลยุทธ์ทางธุรกิจที่ชาญฉลาดในการดึงดูดนักพัฒนาและพันธมิตรมาสร้างระบบนิเวศรอบโมเดลของเมตา

อย่างไรก็ตาม ผู้เชี่ยวชาญบางส่วนแสดงความกังวลเกี่ยวกับความเสี่ยง เช่น การนำโมเดลไปใช้งานในทางที่ผิดกฎหมาย หากไม่มี training data ที่ชัดเจน เมตาจึงได้พัฒนาเครื่องมือด้านความปลอดภัยควบคู่ไปด้วย เพื่อให้แน่ใจว่าโมเดลจะถูกใช้งานอย่างรับผิดชอบ สรุปแล้ว แผนการเปิดซอร์สส่วนประกอบของโมเดล AI รุ่นใหม่นี้ จะเป็นตัวเร่งสำคัญในการขับเคลื่อนการพัฒนา AI แบบยั่งยืนและครอบคลุมทั่วโลก

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)