สารานุกรมบริแทนนิกาฟ้อง OpenAI ฐานใช้บทความเกือบ 100,000 เรื่องฝึกโมเดลโดยไม่ได้รับอนุญาต

บริตานิกะเอ๊นไซโคลพีเดียฟ้องโอเพ่นเอไอ กรณีใช้บทความเกือบ 100,000 ชิ้นฝึกโมเดลเอไอโดยไม่ได้รับอนุญาต

บริตานิกะเอ๊นไซโคลพีเดีย (Encyclopedia Britannica) ซึ่งเป็นหนึ่งในพจนานุกรมสารานุกรมที่มีชื่อเสียงและประวัติศาสตร์ยาวนานที่สุดในโลก ได้ยื่นฟ้องคดีต่อบริษัทโอเพ่นเอไอ (OpenAI) และไมโครซอฟท์ (Microsoft) ในศาลแขวงเขตใต้แห่งนครนิวยอร์ก (United States District Court for the Southern District of New York) เมื่อวันที่ 11 ตุลาคม 2567 โดยกล่าวหาว่าบริษัทดังกล่าวละเมิดลิขสิทธิ์โดยการดึงข้อมูล (scraping) และนำบทความจำนวน 97,605 ชิ้นจากเว็บไซต์ของบริตานิกะมาใช้ในการฝึกโมเดลปัญญาประดิษฐ์ (AI) เช่น ChatGPT โดยไม่ได้รับอนุญาตจากเจ้าของลิขสิทธิ์

คดีนี้ถือเป็นการดำเนินการทางกฎหมายล่าสุดในคลื่นฟ้องร้องที่เพิ่มขึ้นจากสื่อและผู้สร้างเนื้อหาต่อบริษัทพัฒนาเอไอ โดยบริตานิกะระบุในคำฟ้องว่าบริษัทโอเพ่นเอไอได้ละเมิดลิขสิทธิ์โดยตรง (direct copyright infringement) การละเมิดโดยอ้อม (contributory infringement) การละเมิดโดยรับผิดชอบแทนบุคคลอื่น (vicarious infringement) และการรับผลประโยชน์โดยไม่เป็นธรรม (unjust enrichment) คำฟ้องชี้แจงว่าบริษัทโอเพ่นเอไอและไมโครซอฟท์ได้รวบรวมและจัดเก็บบทความของบริตานิกะจำนวนมหาศาลเพื่อใช้เป็นชุดข้อมูลฝึก (training dataset) สำหรับโมเดลภาษาขนาดใหญ่ (large language models หรือ LLMs) โดยไม่เคยขออนุญาตหรือจ่ายค่าลิขสิทธิ์ แม้บริตานิกะจะเคยติดต่อขอเจรจาเรื่องใบอนุญาตในปีก่อนหน้าก็ตาม

ตามเอกสารคำฟ้อง บริตานิกะได้ส่งจดหมายเตือน (cease-and-desist letters) ถึงโอเพ่นเอไอในเดือนมกราคม 2566 เพื่อเรียกร้องให้หยุดใช้เนื้อหาของตนทันที เนื่องจากตรวจพบว่าบริษัทโอเพ่นเอไอได้ดึงข้อมูลบทความจำนวนมากโดยละเมิดข้อกำหนดการใช้งาน (terms of use) ของเว็บไซต์ britannica.com ซึ่งห้ามการดึงข้อมูลจำนวนมากโดยอัตโนมัติ (large-scale scraping) อย่างไรก็ตาม โอเพ่นเอไอไม่ได้ตอบสนองหรือปฏิบัติตามคำร้องขอ จนนำไปสู่การยื่นฟ้องคดีนี้ บริตานิกะยังชี้ให้เห็นว่าบริษัทโอเพ่นเอไอมีนโยบายที่ชัดเจนในการปฏิเสธคำขอใบอนุญาตจากผู้สร้างเนื้อหา โดยอ้างถึง “การใช้งานอย่างเป็นธรรม” (fair use) แต่บริตานิกะโต้แย้งว่าการนำเนื้อหาไปฝึกโมเดลเอไอไม่ใช่การใช้งานอย่างเป็นธรรม เนื่องจากไม่ใช่การเปลี่ยนแปลงให้เกิดสรรพสิ่งใหม่ (transformative use) แต่เป็นการคัดลอกเพื่อสร้างโมเดลที่แข่งขันโดยตรงกับเนื้อหาต้นฉบับ

เนื้อหาของบริตานิกะที่ถูกนำไปใช้มีมูลค่าสูง โดยประกอบด้วยบทความที่เขียนโดยผู้เชี่ยวชาญซึ่งผ่านการตรวจสอบอย่างเข้มงวด (peer-reviewed) และครอบคลุมหัวข้อหลากหลายตั้งแต่ประวัติศาสตร์ วิทยาศาสตร์ ไปจนถึงวัฒนธรรม คำฟ้องระบุว่าบริษัทโอเพ่นเอไอได้ระบุชัดเจนในเอกสารภายในและรายงานวิจัยว่าชุดข้อมูลฝึกของตน รวมถึง Common Crawl ซึ่งเป็นแหล่งข้อมูลหลัก ประกอบด้วยเนื้อหาจากบริตานิกะจำนวนมาก นอกจากนี้ โมเดลเอไอของโอเพ่นเอไอ เช่น GPT-4 สามารถ “คายออกมา” (regurgitate) เนื้อหาจากบริตานิกะได้อย่างแม่นยำเมื่อถูกถามคำถามที่เกี่ยวข้อง ซึ่งเป็นหลักฐานชัดเจนว่าบริษัทได้คัดลอกและฝังเนื้อหาลิขสิทธิ์ไว้ในโมเดล

บริตานิกะเรียกร้องให้ศาลสั่งห้าม (injunction) ไม่ให้โอเพ่นเอไอและไมโครซอฟท์ใช้ ดัดแปลง หรือแจกจ่ายโมเดลที่ฝึกด้วยเนื้อหาลิขสิทธิ์ของตน รวมถึงกำหนดให้ทำลายโมเดลดังกล่าว นอกจากนี้ ยังเรียกค่าเสียหายทางกฎหมาย (statutory damages) สูงสุด 150,000 ดอลลาร์สหรัฐต่อหนึ่งชิ้นงาน ซึ่งหากคำนวณจาก 97,605 ชิ้น จะมีมูลค่ากว่า 14,640 ล้านดอลลาร์สหรัฐ บริตานิกะยืนยันว่าการกระทำของโอเพ่นเอไอไม่เพียงทำลายมูลค่าทางธุรกิจของเนื้อหาเท่านั้น แต่ยังบ่อนทำลายแรงจูงใจในการสร้างสรรค์เนื้อหาคุณภาพสูงสำหรับสาธารณชน

บริษัทโอเพ่นเอไอและไมโครซอฟท์ยังไม่แสดงท่าทีตอบโต้อย่างเป็นทางการต่อคดีนี้ ณ ขณะที่รายงานนี้เผยแพร่ อย่างไรก็ตาม ในคดีที่คล้ายคลึงกันก่อนหน้านี้ เช่น คดีของ The New York Times โอเพ่นเอไอได้โต้แย้งว่าการฝึกโมเดลเอไอด้วยข้อมูลจากเว็บสาธารณะเป็นการใช้งานอย่างเป็นธรรม และโมเดลของตนไม่คัดลอกเนื้อหาต้นฉบับโดยตรง แต่บริตานิกะโต้กลับว่าหลักฐานจากการทดสอบโมเดลแสดงให้เห็นถึงการละเมิดที่ชัดเจน

คดีนี้สะท้อนถึงความขัดแย้งที่รุนแรงขึ้นระหว่างอุตสาหกรรมสื่อกับบริษัทเอไอ โดยบริตานิกะซึ่งก่อตั้งมาตั้งแต่ปี 1768 ถือเป็นสัญลักษณ์ของความรู้ที่เชื่อถือได้ และยืนยันว่าจะปกป้องลิขสิทธิ์ของตนอย่างถึงที่สุดเพื่อรักษามาตรฐานคุณภาพเนื้อหาในยุคดิจิทัลที่เอไอเข้ามามีบทบาทมากขึ้น การพิจารณาคดีนี้อาจกำหนดทิศทางอนาคตของการใช้งานข้อมูลฝึกเอไอในวงการเทคโนโลยี

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)