ความสามารถทางไซเบอร์รุกคืบของ ai เพิ่มเป็นสองเท่าทุก 6 เดือน นักวิจัยด้านความปลอดภัยพบ

ความสามารถด้านการโจมตีทางไซเบอร์ด้วยปัญญาประดิษฐ์เพิ่มขึ้นเป็นสองเท่าทุกหกเดือน นักวิจัยด้านความปลอดภัยค้นพบ

นักวิจัยด้านความปลอดภัยจากองค์กร Apollo Research ได้เผยแพร่รายงานชื่อ “Frontier Risk Report: Offensive Cyber Capabilities” ซึ่งชี้ให้เห็นว่าความสามารถของระบบปัญญาประดิษฐ์ (AI) ในการดำเนินการโจมตีทางไซเบอร์แบบรุกคืบ กำลังปรับตัวเพิ่มขึ้นอย่างรวดเร็วตามการขยายตัวของพลังประมวลผล (compute) โดยเฉพาะอย่างยิ่ง พวกเขาพบว่าความสามารถดังกล่าวเพิ่มขึ้นเป็นสองเท่าทุกประมาณหกเดือน ซึ่งเป็นอัตราการเติบโตที่เทียบเท่ากับกฎของมอร์ (Moore’s Law) ในยุคแรกเริ่ม

รายงานดังกล่าวประเมินโมเดล AI ชั้นนำ 8 โมเดล ได้แก่ o1-preview, o1-mini, Claude 3.5 Sonnet, GPT-4o, Llama 3.1 405B, DeepSeek R1, DeepSeek V3 และ Qwen 2.5 110B โดยใช้ชุดเกณฑ์มาตรฐาน (benchmark) ที่ออกแบบมาเพื่อวัดความสามารถด้านการโจมตีทางไซเบอร์แบบอัตโนมัติ เกณฑ์เหล่านี้ครอบคลุมงานที่เกี่ยวข้องกับการโจมตีทางไซเบอร์ในระดับต่างๆ ตั้งแต่การค้นหาช่องโหว่ การพัฒนาโค้ดโจมตี ไปจนถึงการทดสอบการโจมตีจริง

เกณฑ์มาตรฐานและวิธีการประเมิน

Apollo Research ได้พัฒนาเกณฑ์มาตรฐานที่เน้นการวัดระดับการอัตโนมัติ (automation levels) ในงานไซเบอร์โจมตี โดยแบ่งออกเป็นระดับ 0 ถึง 10 โดยระดับ 10 คือการดำเนินการโจมตีแบบครบวงจรอย่างสมบูรณ์แบบอัตโนมัติ งานหลักที่ใช้ประเมิน ได้แก่:

  • CVE Filling: การเติมข้อมูลช่องโหว่ (Common Vulnerabilities and Exposures) โดยให้โมเดลสรุปช่องโหว่ สร้าง proof-of-concept (PoC) exploit และแนะนำโค้ดโจมตีจาก CVE ที่มีอยู่จริง 155 รายการ
  • Atomic Red Team Tests: การทดสอบการโจมตีตามมาตรฐาน Atomic Red Team ซึ่งเป็นชุดทดสอบการโจมตีทางไซเบอร์ที่เป็นมาตรฐานอุตสาหกรรม โดยโมเดลต้องสร้างโค้ดที่ใช้งานได้จริงเพื่อทดสอบเทคนิคการโจมตี 15 รายการ
  • Vulnerability Research: การค้นหาช่องโหว่ใหม่ในซอฟต์แวร์สมมติ โดยให้โมเดลวิเคราะห์โค้ดและค้นหาช่องโหว่ที่อาจถูกนำไปใช้โจมตี

วิธีการทดสอบใช้แนวทาง red teaming ซึ่งจำลองสถานการณ์การโจมตีจริง โดยให้โมเดลทำงานในสภาพแวดล้อมที่จำกัดการเข้าถึงข้อมูลภายนอก เพื่อวัดความสามารถแบบ end-to-end นักวิจัยยังปรับปรุงเกณฑ์ให้ท้าทายมากขึ้น โดยใช้ข้อมูลจาก CVE จริงและซอฟต์แวร์ที่ซับซ้อน เพื่อให้ผลลัพธ์สะท้อนความสามารถในโลกจริง

ผลการทดสอบและแนวโน้มการเติบโต

ผลการทดสอบเผยให้เห็นว่าโมเดลชั้นนำปัจจุบันสามารถเข้าถึงระดับการอัตโนมัติ 5 ถึง 7 ในงาน CVE Filling และ Atomic Red Team โดยเฉพาะโมเดล o1-preview และ Claude 3.5 Sonnet แสดงผลงานดีที่สุด โดย o1-preview สามารถสร้าง exploit ที่ใช้งานได้จริงใน 20 จาก 77 CVE และผ่านการทดสอบ Atomic Red Team ได้ 10 จาก 15 รายการ

ที่สำคัญคือ Apollo พบแนวโน้มการเติบโตแบบทวีคูณ โดยเปรียบเทียบผลงานของโมเดลต่างๆ ตามพลังประมวลผลที่ใช้ฝึก ความสามารถในการโจมตีทางไซเบอร์เพิ่มขึ้นเป็นสองเท่าทุกหกเดือน ซึ่งเร็วกว่าอัตราการเติบโตของความสามารถทางภาษาหรือการเขียนโค้ด หากแนวโน้มนี้ดำเนินต่อไป คาดว่าโมเดลในปี 2570 (ค.ศ. 2027) จะสามารถดำเนินการโจมตีทางไซเบอร์ที่มีผลกระทบสูงแบบอัตโนมัติครบวงจรได้ ซึ่งอาจนำไปสู่ความเสี่ยงใหม่ในด้านความมั่นคงทางไซเบอร์

ตัวอย่างผลงานเฉพาะ เช่น ใน CVE-2021-44228 (Log4Shell) โมเดลชั้นนำสามารถสร้าง PoC exploit ได้อย่างถูกต้อง แต่ยังมีข้อจำกัดในงานที่ซับซ้อน เช่น การรวมหลายขั้นตอนหรือหลีกเลี่ยงการตรวจจับ นอกจากนี้ โมเดล open-weight อย่าง Llama 3.1 405B แสดงศักยภาพใกล้เคียงกับโมเดลปิด ซึ่งบ่งชี้ว่าความเสี่ยงจะแพร่กระจายไปยังผู้เล่นที่หลากหลายมากขึ้น

ความเสี่ยงและข้อเสนอแนะ

รายงานเตือนว่าความก้าวหน้าดังกล่าวอาจนำไปสู่การโจมตีทางไซเบอร์ที่ซับซ้อนและมีปริมาณมากขึ้น โดยเฉพาะจากผู้ไม่หวังดีที่ใช้ AI เป็นเครื่องมือขยาย規模การโจมตี ปัจจุบัน โมเดลยังคงต้องการการแทรกแซงจากมนุษย์ในขั้นตอนสำคัญ เช่น การทดสอบและปรับแต่ง แต่การอัตโนมัติที่เพิ่มขึ้นจะลดอุปสรรคเหล่านี้ลง

Apollo แนะนำให้ผู้พัฒนา AI ควร:

  • พัฒนามาตรการป้องกันเฉพาะสำหรับความสามารถทางไซเบอร์ เช่น การจำกัดเครื่องมือและการเข้าถึงข้อมูลช่องโหว่
  • ลงทุนในงานวิจัยด้านความปลอดภัยเชิงรุก (proactive safety research)
  • สร้างชุมชนและมาตรฐานร่วมกันเพื่อติดตามและบรรเทาความเสี่ยง

นอกจากนี้ รายงานยังชี้ว่าการเติบโตของความสามารถนี้เชื่อมโยงโดยตรงกับการเพิ่มพลังประมวลผล โดยไม่ขึ้นกับสถาปัตยกรรมโมเดล ซึ่งทำให้การพยากรณ์มีความน่าเชื่อถือสูง

บทสรุป

การค้นพบนี้เน้นย้ำถึงความจำเป็นเร่งด่วนในการจัดการความเสี่ยงจาก AI ในด้านไซเบอร์ โดย Apollo Research เชื่อว่าหากไม่มีการแทรกแซงที่เหมาะสม ความสามารถเหล่านี้อาจนำไปสู่การเปลี่ยนแปลงภูมิทัศน์ความมั่นคงทางไซเบอร์อย่างสิ้นเชิง รายงานฉบับเต็มพร้อมข้อมูลละเอียดสามารถดาวน์โหลดได้จากเว็บไซต์ของ Apollo Research เพื่อให้ผู้สนใจในอุตสาหกรรมสามารถนำไปประยุกต์ใช้ในการวางแผนกลยุทธ์ความปลอดภัย

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)