ข้ออ้างส่อเค้าหลอกลวงแพร่สะพัดบนโซเชียลมีเดียว่าเนื้อหาเว็บส่วนใหญ่ถูกสร้างโดย ai

การวิเคราะห์ความถูกต้องของการกล่าวอ้างที่ว่าเนื้อหาเว็บส่วนใหญ่ถูกสร้างโดยปัญญาประดิษฐ์

ในช่วงไม่กี่เดือนที่ผ่านมา ได้เกิดการแพร่หลายของข้อมูลที่กล่าวอ้างบนแพลตฟอร์มโซเชียลมีเดียและในบทความข่าวบางฉบับว่า ปริมาณเนื้อหาบนอินเทอร์เน็ตที่ถูกสร้างขึ้นโดยปัญญาประดิษฐ์ (AI) นั้นได้แซงหน้าเนื้อหาที่สร้างโดยมนุษย์ไปแล้ว ซึ่งนำไปสู่การคาดการณ์ถึงการเปลี่ยนแปลงครั้งใหญ่ในภูมิทัศน์ดิจิทัล อย่างไรก็ตาม การตรวจสอบเชิงลึกต่อข้อมูลพื้นฐานที่ใช้ในการกล่าวอ้างเหล่านี้กลับเผยให้เห็นถึงข้อบกพร่องทางระเบียบวิธีวิจัยและสถิติที่สำคัญ ทำให้จำเป็นต้องมีการประเมินอย่างรอบคอบถึงความน่าเชื่อถือของตัวเลขเหล่านี้

การกล่าวอ้างที่โดดเด่นและแพร่หลายที่สุดประการหนึ่งมาจากรายงานของ Cheq, ซึ่งเป็นบริษัทซอฟต์แวร์ด้านความปลอดภัยทางไซเบอร์ ในรายงานฉบับหนึ่งของ Cheq ได้มีการประมาณการว่า ในปี 2023 มีเนื้อหาที่ถูกสร้างโดย AI คิดเป็นสัดส่วนสูงถึง 90% ของเนื้อหาทั้งหมดบนอินเทอร์เน็ต ตัวเลขที่สูงลิ่วนี้ได้ถูกหยิบยกขึ้นมาใช้อย่างกว้างขวางในบริบทที่เน้นย้ำถึงการครอบงำของแบบจำลองภาษาขนาดใหญ่ (Large Language Models - LLMs) และเครื่องมือสร้างเนื้อหาอัตโนมัติอื่นๆ อย่างไรก็ตาม เมื่อพิจารณาจากระเบียบวิธีวิจัยที่ Cheq ใช้ในการรวบรวมข้อมูล ตัวเลขดังกล่าวกลับกลายเป็นว่ามีขอบเขตและบริบทที่จำกัด การระบุที่มาของตัวเลข 90% นี้ ไม่ได้มาจากปริมาณเนื้อหาทั้งหมดบนเว็บไซต์ แต่มาจากการประเมิน “เนื้อหาที่ไม่ใช่ของมนุษย์ หรือเนื้อหาที่เป็นบอท” ที่พบในระบบนิเวศการโฆษณาออนไลน์ (Ad Ecosystem) ของ Cheq เอง ซึ่งเป็นการประเมินเฉพาะในส่วนของ “การเข้าชมที่เป็นบอท” (Bot Traffic) ไม่ใช่เนื้อหาทั้งหมดบนอินเทอร์เน็ต การขยายผลตัวเลขนี้ไปใช้เป็นตัวแทนของเนื้อหาเว็บโดยรวมทั้งหมดจึงเป็นการบิดเบือนข้อมูลอย่างร้ายแรง

ยิ่งไปกว่านั้น การอ้างอิงถึงการศึกษาจากบุคคลที่สามที่ถูกนำมาใช้สนับสนุนข้อสรุปนี้ก็ยังขาดความชัดเจน Cheq กล่าวถึงการศึกษาที่ระบุว่า เนื้อหา 87% ในปี 2022 และ 90% ในปี 2023 ถูกสร้างโดย AI โดยไม่มีการให้รายละเอียดที่มาของการศึกษานั้นอย่างเพียงพอ การขาดความโปร่งใสนี้ทำให้ยากต่อการตรวจสอบและยืนยันระเบียบวิธีวิจัยและความแม่นยำของตัวเลขที่ถูกนำมาอ้างอิง

ในทำนองเดียวกัน การอ้างอิงถึงข้อมูลของ Cloudflare ซึ่งเป็นผู้ให้บริการโครงสร้างพื้นฐานอินเทอร์เน็ตรายใหญ่ ก็ถูกนำไปใช้ในบทความข่าวบางฉบับเพื่อสนับสนุนแนวคิดที่ว่า AI ได้กลายเป็นผู้สร้างเนื้อหาส่วนใหญ่ไปแล้ว ในเดือนธันวาคม 2023 Cloudflare ได้รายงานว่าการเข้าชมเว็บไซต์เกือบ 72% มาจากบอท อย่างไรก็ตาม การตีความตัวเลขนี้ว่าหมายถึงปริมาณเนื้อหาทั้งหมดที่ถูกสร้างโดย AI นั้นเป็นการตีความที่ผิดพลาดอย่างสิ้นเชิง Cloudflare ชี้แจงอย่างชัดเจนว่าตัวเลขดังกล่าวหมายถึงการเข้าชมที่เป็นบอท ซึ่งรวมถึงบอทที่มีประโยชน์ เช่น เครื่องมือรวบรวมข้อมูลของเครื่องมือค้นหา (Search Engine Crawlers) และบอทที่เป็นอันตราย เช่น Scrapers และ Spammers ซึ่งมีตั้งแต่บอทที่คัดลอกเนื้อหาไปจนถึงบอทที่ดำเนินการตามปกติของระบบอินเทอร์เน็ต ไม่ใช่เนื้อหาที่ถูกสร้างขึ้นโดย AI

การแพร่กระจายของตัวเลขเหล่านี้บนโซเชียลมีเดีย มักจะเกิดขึ้นโดยไม่มีการระบุที่มาและบริบทที่ชัดเจน ทำให้ผู้ใช้เข้าใจผิดว่าเนื้อหาส่วนใหญ่ที่พวกเขาบริโภค ไม่ว่าจะเป็นบทความ ข่าว หรือแม้แต่โพสต์ทั่วไป ได้ถูกสร้างขึ้นโดยเครื่องจักรแล้ว ซึ่งการเข้าใจผิดเช่นนี้อาจนำไปสู่ความกังวลที่เพิ่มมากขึ้นเกี่ยวกับ “ภาวะเนื้อหาเน่าเปื่อย” (Content Degeneration) หรือภาวะที่อินเทอร์เน็ตเต็มไปด้วยข้อมูลคุณภาพต่ำที่ถูกสร้างโดยหุ่นยนต์

ในฐานะนักเทคนิคอลไรเตอร์ระดับอาวุโส การวิเคราะห์นี้เน้นย้ำถึงความจำเป็นในการแยกแยะอย่างเข้มงวดระหว่าง “ปริมาณการเข้าชมของบอท” (ซึ่งสูงอย่างมีนัยสำคัญ) กับ “ปริมาณเนื้อหาที่ถูกสร้างโดย AI ที่แท้จริง” (ซึ่งกำลังเพิ่มขึ้น แต่ยังไม่มีหลักฐานที่น่าเชื่อถือว่าแซงหน้าเนื้อหาของมนุษย์ไปแล้ว) การนำเสนอตัวเลขที่ขาดบริบทเช่นนี้เป็นเพียงการสร้างกระแสเกินจริง ซึ่งอาจบั่นทอนความเข้าใจที่แท้จริงเกี่ยวกับอิทธิพลของ AI ต่อภูมิทัศน์ข้อมูลในปัจจุบัน

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)