Anthropic กล่าวหา DeepSeek, Moonshot และ MiniMax ว่าขโมยข้อมูล AI ของ Claude ผ่านการสอบถาม 16 ล้านครั้ง

แอนโทรปิกกล่าวหาบริษัทปัญญาประดิษฐ์จีนสามแห่งว่าขโมยข้อมูลโมเดล Claude ผ่านการสอบถามกว่า 16 ล้านครั้ง

แอนโทรปิก (Anthropic) บริษัทพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) ชั้นนำของสหรัฐอเมริกา ได้ยื่นฟ้องต่อศาลกลางสหรัฐฯ โดยกล่าวหาบริษัทปัญญาประดิษฐ์จีนสามแห่ง ได้แก่ DeepSeek, Moonshot AI และ MiniMax ว่าดำเนินการขโมยข้อมูลจากโมเดล Claude ของตน เพื่อนำไปใช้ฝึกโมเดลของตนเอง การกระทำดังกล่าวเกิดขึ้นผ่านการส่งคำถามสอบถาม (queries) กว่า 16 ล้านครั้งในช่วงเวลาสั้นๆ ซึ่งถือเป็นการละเมิดสิทธิ์และก่อให้เกิดความเสียหายต่อระบบโครงสร้างพื้นฐานทางปัญญาประดิษฐ์ของแอนโทรปิก

การตรวจพบพฤติกรรมผิดปกติในระบบ Claude

แอนโทรปิกตรวจพบกิจกรรมผิดปกติในระบบโมเดล Claude ตั้งแต่ช่วงปลายปี 2567 โดยสังเกตเห็นการส่งคำถามสอบถามจำนวนมหาศาลจากที่อยู่ IP (Internet Protocol address) ที่ตั้งอยู่ในศูนย์ข้อมูล (data centers) ของจีน โดยเฉพาะอย่างยิ่งจากผู้ให้บริการคลาวด์รายใหญ่ เช่น Alibaba Cloud, Tencent Cloud และ China Mobile การสอบถามเหล่านี้มีลักษณะเฉพาะตัว เช่น การส่งคำถามซ้ำๆ ในรูปแบบที่คล้ายคลึงกัน การสอบถามโค้ดโปรแกรมจำนวนมาก และการทดสอบขอบเขตความสามารถของโมเดลในลักษณะที่ไม่ใช่การใช้งานปกติของผู้ใช้ทั่วไป

จากข้อมูลที่แอนโทรปิกรวบรวม พบว่าบริษัท DeepSeek ส่งคำถามสอบถามกว่า 6.6 ล้านครั้งต่อโมเดล Claude 3.5 Sonnet ในเวลาเพียงไม่กี่วัน โดยมีอัตราการส่งคำถามสูงถึง 50 คำถามต่อวินาที ในทำนองเดียวกัน Moonshot AI ซึ่งเป็นผู้พัฒนาโมเดล Kimi ส่งคำถามกว่า 3 ล้านครั้งต่อโมเดล Claude 3 Opus และ Claude 3.5 Haiku ส่วน MiniMax ผู้พัฒนาโมเดล abab6.5s-chat และ abab6.5s ถูกกล่าวหาว่าส่งคำถามกว่า 700,000 ครั้งต่อโมเดล Claude 3.5 Sonnet การกระทำเหล่านี้เกิดขึ้นก่อนที่โมเดลดังกล่าวจะเปิดตัวสู่สาธารณะ ซึ่งบ่งชี้ถึงความพยายามในการรวบรวมข้อมูลล่วงหน้า

กลไกการขโมยข้อมูล: การกลั่นกรองโมเดล (Model Distillation)

ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์มองว่าการกระทำดังกล่าวเป็นรูปแบบของ “model distillation” หรือ “data extraction attack” ซึ่งเป็นเทคนิคที่ใช้ในการขโมยความรู้จากโมเดล LLM ของผู้อื่น โดยการส่งคำถามจำนวนมากเพื่อรับคำตอบจากโมเดลเป้าหมาย แล้วนำคำตอบเหล่านั้นไปฝึกโมเดลของตนเองให้มีประสิทธิภาพใกล้เคียงกัน โดยไม่ต้องลงทุนพัฒนาจากศูนย์ แอนโทรปิกชี้ให้เห็นว่าการสอบถามจากบริษัทเหล่านี้มีรูปแบบที่ชัดเจน เช่น การสอบถามคำสั่งโค้ดที่ซับซ้อน การทดสอบการให้เหตุผลเชิงตรรกะ และการสร้างเนื้อหาเฉพาะทาง ซึ่งตรงกับจุดเด่นของโมเดล Claude

หลักฐานที่แอนโทรปิกนำเสนอรวมถึงการติดตามที่อยู่ IP ไปยังบัญชีผู้ใช้ที่เชื่อมโยงกับบริษัทผู้ถูกกล่าวหา เช่น บัญชีของ DeepSeek ที่ใช้ชื่อ “deepseek-ai” และการลงทะเบียนโดเมนที่เกี่ยวข้อง นอกจากนี้ แอนโทรปิกยังพบว่าบริษัทเหล่านี้ใช้ VPN และพร็อกซีเพื่อปกปิดตัวตน แต่ระบบตรวจจับของแอนโทรปิกสามารถระบุแหล่งกำเนิดที่แท้จริงได้

การตอบสนองทางกฎหมายและมาตรการทางเทคนิค

แอนโทรปิกได้ยื่นคำร้องต่อศาลกลางเขตนอร์เทิร์นแห่งแคลิฟอร์เนีย (U.S. District Court for the Northern District of California) เมื่อวันที่ 21 พฤศจิกายน 2567 โดยขอให้ศาลออกคำสั่งห้าม (injunction) เพื่อหยุดยั้งการเข้าถึงโมเดล Claude ของบริษัทผู้ถูกกล่าวหา รวมถึงเรียกค่าเสียหายจากการละเมิดกฎหมายสหรัฐฯ เช่น Computer Fraud and Abuse Act (CFAA), การบุกรุกทรัพย์สิน (trespass to chattels) และการละเมิดข้อตกลงการใช้งาน (terms of service)

ในด้านเทคนิค แอนโทรปิกได้ใช้มาตรการจำกัดอัตราการสอบถาม (rate limiting) และระบบตรวจจับพฤติกรรมอัตโนมัติเพื่อป้องกันการโจมตีประเภทนี้ อย่างไรก็ตาม บริษัทผู้ถูกกล่าวหายังคงหาทางเลี่ยง โดยใช้บัญชีผู้ใช้หลายรายการและเครื่องมือหลบเลี่ยงการตรวจจับ แอนโทรปิกยืนยันว่าการกระทำดังกล่าวไม่เพียงแต่ละเมิดสิทธิ์ทางทรัพย์สินทางปัญญาเท่านั้น แต่ยังก่อให้เกิดความเสี่ยงด้านความปลอดภัย เช่น การเปิดช่องโหว่ให้กับการโจมตีแบบ prompt injection หรือการรั่วไหลของข้อมูล

ความหมายต่ออุตสาหกรรมปัญญาประดิษฐ์

เหตุการณ์นี้สะท้อนถึงความท้าทายที่เพิ่มขึ้นในอุตสาหกรรม LLM โดยเฉพาะการแข่งขันระหว่างบริษัทสหรัฐฯ กับบริษัทจีน ซึ่งบริษัทจีนหลายแห่ง เช่น DeepSeek ได้พัฒนาโมเดลประสิทธิภาพสูงในราคาต่ำกว่ามาก เช่น DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัว และสามารถแข่งขันกับโมเดลชั้นนำได้ แอนโทรปิกมองว่าการขโมยข้อมูลเช่นนี้เป็นอุปสรรคต่อการลงทุนด้านการวิจัยและพัฒนา (R&D) มูลค่าหลายพันล้านดอลลาร์สหรัฐฯ ของบริษัทตะวันตก

คดีนี้ยังเป็นตัวอย่างของการบังคับใช้กฎหมายข้ามชาติ โดยแอนโทรปิกหวังว่าจะสร้างมาตรฐานในการปกป้องโมเดล AI จากการขโมยข้อมูล หากศาลรับคำร้อง อาจนำไปสู่การเปลี่ยนแปลงนโยบายการเข้าถึง API ของผู้ให้บริการ LLM ทั่วโลก และกระตุ้นให้เกิดมาตรการป้องกันที่เข้มงวดยิ่งขึ้น

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)