ท่อส่ง AI แบบเอเจนติกของ Mozilla ปล่อย Claude Mythos Preview และค้นพบช่องโหว่ Firefox ที่ไม่รู้จัก 271 ช่อง

มอซิยลลานำเสนอระบบท่อส่งข้อมูล AI แบบเอเจนติก ค้นพบช่องโหว่ฟีเจอร์ฟ็อกซ์ที่ไม่เคยทราบมาก่อน 271 รายการ

มอซิยลลา (Mozilla) ได้พัฒนาระบบท่อส่งข้อมูลปัญญาประดิษฐ์ (AI) แบบเอเจนติก ซึ่งสามารถค้นพบช่องโหว่ความปลอดภัยในเบราว์เซอร์ฟีเจอร์ฟ็อกซ์ (Firefox) ที่ไม่เคยทราบมาก่อนถึง 271 รายการ โดยระบบดังกล่าวใช้โมเดล Claude 3.5 Sonnet จาก Anthropic ร่วมกับเฟรมเวิร์ก Mythos ในเวอร์ชันทดลอง ซึ่งเป็นเครื่องมือใหม่สำหรับการพัฒนาเอเจนต์ AI ที่มีความสามารถสูง

ระบบนี้มีชื่อเรียกว่า “Agent Fuzz” ซึ่งรวมการฟัซซิง (fuzzing) เข้ากับการวิเคราะห์โดย AI เพื่อค้นหาช่องโหว่ในโปรแกรม โดยเริ่มต้นจากการใช้เครื่องมือฟัซซิง fuzzmanager ของฟีเจอร์ฟ็อกซ์เพื่อสร้างข้อมูลอินพุตสุ่มจำนวนมหาศาล จนทำให้เกิดการขัดข้อง (crash) ของโปรแกรม จากนั้น Claude จะเข้ามาวิเคราะห์สแต็กเทรซ (stack trace) และข้อมูลการขัดข้อง เพื่อตั้งสมมติฐานเกี่ยวกับสาเหตุรากฐานของปัญหา

กระบวนการทำงานของระบบ Agent Fuzz สามารถแบ่งออกเป็นขั้นตอนหลักดังนี้ ประการแรก คือการฟัซซิงเบื้องต้น โดย fuzzmanager จะรันการทดสอบนับพันล้านครั้งเพื่อค้นหาการขัดข้องใหม่ๆ เมื่อเกิดการขัดข้อง Claude จะถูกเรียกใช้เพื่อสรุปสาเหตุที่เป็นไปได้ โดยโมเดล AI นี้สามารถวิเคราะห์โค้ดแอสเซมบลี (assembly code) และข้อมูลการขัดข้องได้อย่างละเอียด ถัดมา ระบบจะพยายามทำซ้ำการขัดข้อง (reproduce the crash) โดยใช้เทคนิค delta debugging เพื่อลดขนาดข้อมูลอินพุตให้เล็กลงและเข้าใจง่ายขึ้น

หลังจากนั้น ระบบจะเข้าสู่ขั้นตอนการวิเคราะห์สาเหตุรากฐาน (root cause analysis) โดย Claude จะสร้างแพตช์ (patch) ทดลองเพื่อยืนยันสมมติฐาน หากแพตช์ทำงานได้ ระบบจะยืนยันว่าช่องโหว่นั้นเป็นของจริง จากนั้นจะจัดหมวดหมู่ช่องโหว่ตามประเภท เช่น use-after-free, buffer overflow หรือ integer overflow และสร้างรายงานสรุปสำหรับนักพัฒนา

ในการทดสอบจริง ทีมมอซิยลลาได้รันระบบ Agent Fuzz ติดต่อกันนาน 40 วัน โดยประมวลผลการรันโปรแกรมทั้งหมด 1.2 พันล้านครั้ง สร้างการขัดข้องทั้งสิ้น 37,000 ครั้ง และคัดกรองได้ช่องโหว่ที่ไม่ซ้ำกัน 271 รายการ ซึ่งทั้งหมดได้รับการยืนยันและจัดสรร CVE (Common Vulnerabilities and Exposures) โดยช่องโหว่เหล่านี้ส่วนใหญ่เป็นปัญหาที่ไม่เคยตรวจพบมาก่อน แม้จะใช้เครื่องมือฟัซซิงแบบดั้งเดิม

ผลการทดสอบแสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าเครื่องมือฟัซซิงพื้นฐาน โดย Agent Fuzz มีอัตราความแม่นยำ (precision) สูงถึง 94.8% และอัตราการเรียกคืน (recall) 85.1% เมื่อเปรียบเทียบกับ baseline fuzzer ซึ่งมี precision เพียง 0.01% และ recall 39.1% นอกจากนี้ ระบบยังสามารถตรวจพบช่องโหว่ที่หลากหลายกว่าถึง 4 เท่า โดยเฉพาะช่องโหว่ที่เกี่ยวข้องกับการจัดการหน่วยความจำและการคำนวณตัวเลข

ทีมพัฒนาได้ปรับแต่ง Claude ให้เหมาะสมกับงานนี้ โดยใช้ prompt engineering ที่ละเอียด เพื่อให้ AI สามารถจัดการกับข้อมูลทางเทคนิคที่ซับซ้อน เช่น การอ่านสแต็กเทรซยาวหลายพันบรรทัด และการสร้าง hypothesis ที่น่าเชื่อถือ Mythos preview ช่วยให้ระบบทำงานแบบเอเจนติกได้ดีขึ้น โดยแบ่งงานย่อยเป็นขั้นตอนและเรียกใช้เครื่องมือภายนอก เช่น compiler หรือ debugger ตามความจำเป็น

ช่องโหว่ที่ค้นพบส่วนใหญ่ได้รับการแก้ไขแล้ว โดยทีมฟีเจอร์ฟ็อกซ์ได้รวมแพตช์จาก Agent Fuzz เข้าสู่เวอร์ชันปล่อยจริงหลายรายการ ซึ่งช่วยยกระดับความปลอดภัยของเบราว์เซอร์ให้สูงขึ้น นอกจากนี้ มอซิยลลายังวางแผนเปิดซอร์สโค้ดบางส่วนของระบบ เพื่อให้ชุมชนนักพัฒนาความปลอดภัยสามารถนำไปใช้ประโยชน์ได้

การประสบความสำเร็จครั้งนี้พิสูจน์ให้เห็นถึงศักยภาพของ AI แบบเอเจนติกในการเปลี่ยนแปลงกระบวนการวิจัยความปลอดภัยซอฟต์แวร์แบบดั้งเดิม จากที่เคยพึ่งพามนุษย์ในการวิเคราะห์การขัดข้องซึ่งใช้เวลานานและมีข้อจำกัด ตอนนี้ AI สามารถทำงานอัตโนมัติได้เกือบทั้งหมด ลดเวลาจากหลายสัปดาห์เหลือเพียงไม่กี่ชั่วโมง และค้นพบช่องโหว่ที่มนุษย์อาจมองข้าม

อย่างไรก็ตาม ทีมมอซิยลลายังระบุข้อจำกัดบางประการ เช่น Claude อาจสร้าง hypothesis ที่ผิดพลาดในบางกรณี โดยเฉพาะช่องโหว่ที่ซับซ้อนมาก และระบบยังต้องการการปรับแต่ง prompt เพื่อให้เหมาะกับโปรแกรมอื่นๆ นอกเหนือจากฟีเจอร์ฟ็อกซ์ แต่โดยรวมแล้ว Agent Fuzz ถือเป็นก้าวกระโดดสำคัญในการใช้ AI เพื่อความปลอดภัยทางไซเบอร์

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)