ภารกิจเจนเนซิส

Genesis: ภารกิจรวบรวมข้อมูลสหรัฐอเมริกาเพื่อโมเดลปัญญาประดิษฐ์

Scale AI บริษัทชั้นนำด้านการพัฒนาข้อมูลสำหรับปัญญาประดิษฐ์ (AI) ได้เปิดตัวโครงการ Genesis ซึ่งเป็นความริเริ่มเชิงกลยุทธ์เพื่อรวบรวมชุดข้อมูลขนาดใหญ่ที่เป็นกรรมสิทธิ์ของสหรัฐอเมริกา โดยมุ่งเน้นการสร้างฐานข้อมูลคุณภาพสูงสำหรับการฝึกโมเดล AI รุ่นถัดไป โครงการนี้มีเป้าหมายเพื่อเสริมสร้างความมั่นคงทางข้อมูลของสหรัฐฯ ท่ามกลางการแข่งขันด้าน AI กับจีน ซึ่งจีนมีข้อได้เปรียบจากปริมาณข้อมูลมหาศาลที่สามารถเข้าถึงได้อย่างเสรี

Alexandr Wang ผู้ก่อตั้งและซีอีโอของ Scale AI ประกาศเปิดตัว Genesis ผ่านโพสต์บนเครือข่ายสังคมออนไลน์ โดยระบุว่าโครงการนี้จะเป็น “ชุดข้อมูลที่ใหญ่ที่สุดในโลกที่เป็นกรรมสิทธิ์ของสหรัฐอเมริกา” Wang เน้นย้ำถึงความสำคัญของข้อมูลคุณภาพสูงจากแหล่งข้อมูลอเมริกันแท้ๆ เพื่อหลีกเลี่ยงปัญหาการปนเปื้อนทางวัฒนธรรมและความลำเอียงที่อาจเกิดจากข้อมูลต่างชาติ โครงการ Genesis จึงมุ่งรวบรวมข้อมูลที่สะท้อนมุมมอง ค่านิยม และบริบทของสหรัฐฯ โดยตรง เพื่อให้โมเดล AI สามารถเข้าใจและตอบสนองต่อผู้ใช้ชาวอเมริกันได้อย่างแม่นยำยิ่งขึ้น

หนึ่งในกลยุทธ์หลักของ Genesis คือการสร้างพันธมิตรกับองค์กรชั้นนำในสหรัฐฯ เพื่อเข้าถึงข้อมูลหลากหลายประเภท โดยเริ่มต้นด้วย News Corp เจ้าของสำนักพิมพ์ Wall Street Journal และ New York Post ซึ่งจะให้สิทธิ์เข้าถึงคลังบทความข่าวกว่า 250 ล้านชิ้นตั้งแต่ปี 1980 เป็นต้นมา นอกจากนี้ ยังมีพันธมิตรอื่นๆ เช่น Reddit ซึ่งมีผู้ใช้กว่า 1 พันล้านรายและโพสต์กว่า 2 พันล้านรายการ Eventbrite สำหรับข้อมูลกิจกรรมและตั๋วคอนเสิร์ต และหน่วยงานอื่นๆ เช่น ThoughtSpot, Labelbox และ WorldQuant

โครงการนี้ครอบคลุมข้อมูลหลายรูปแบบ เพื่อตอบโจทย์การฝึกโมเดล AI แบบมัลติโมดัล ได้แก่ ข้อมูลข้อความ (text) จากบทความข่าว โพสต์โซเชียลมีเดีย รีวิวเหตุการณ์ และเอกสารทางกฎหมาย ข้อมูลภาพ (images) จากภาพถ่ายข่าวและเนื้อหาเว็บไซต์ ข้อมูลวิดีโอ (video) จากคลิปข่าวและกิจกรรมสด และข้อมูลเสียง (audio) จากพอดแคสต์และการสัมภาษณ์ ข้อมูลเหล่านี้จะถูกจัดเรียงและ标注 (labeling) อย่างละเอียดเพื่อให้เหมาะสมสำหรับการฝึกโมเดล โดย Scale AI วางแผนปล่อยชุดข้อมูล首批 (initial releases) ภายในไม่กี่เดือนข้างหน้า

Wang ชี้ให้เห็นถึงความเสี่ยงของสหรัฐฯ ในด้านการขาดแคลนข้อมูลคุณภาพ หากเทียบกับจีนที่สามารถดึงข้อมูลจากแพลตฟอร์มอย่าง Weibo, Douyin และ Baidu ได้อย่างอิสระโดยไม่ต้องกังวลเรื่องลิขสิทธิ์ ในขณะที่สหรัฐฯ ต้องเผชิญกับกฎระเบียบเข้มงวด เช่น Digital Millennium Copyright Act (DMCA) และการฟ้องร้องจากผู้ถือลิขสิทธิ์ เช่น New York Times ที่เพิ่งฟ้อง OpenAI และ Microsoft ไปเมื่อเร็วๆ นี้ Genesis จึงเป็นการตอบโต้เชิงรุก โดยอาศัยการเจรจาข้อตกลงลิขสิทธิ์ที่ถูกต้องตามกฎหมาย เพื่อสร้างฐานข้อมูลที่โปร่งใสและยั่งยืน

ความสำเร็จของ Genesis ได้รับการสนับสนุนจากนักลงทุนชั้นนำ เช่น Accel, Amazon, Meta, NVIDIA และ Tiger Global ซึ่งเคยระดมทุนให้ Scale AI กว่า 1.6 พันล้านดอลลาร์สหรัฐ ทำให้บริษัทมีมูลค่าตลาดสูงถึง 14 พันล้านดอลลาร์ นอกจากนี้ โครงการนี้ยังสอดคล้องกับนโยบายของรัฐบาลสหรัฐฯ ในการส่งเสริม “data sovereignty” หรืออธิปไตยทางข้อมูล เพื่อลดการพึ่งพาแหล่งข้อมูลต่างชาติ โดยเฉพาะจากจีนที่ถูกมองว่าเป็นคู่แข่งหลักในสงคราม AI

พันธมิตรอย่าง Reddit ยืนยันถึงคุณค่าของข้อตกลงนี้ โดย Drew Vollero หัวหน้าฝ่ายหุ้นส่วนธุรกิจของ Reddit กล่าวว่า “การร่วมมือกับ Scale AI จะช่วยให้เราสามารถควบคุมและสร้างมูลค่าจากข้อมูลของชุมชนเราได้อย่างมีประสิทธิภาพมากขึ้น” ขณะที่ News Corp มองว่านี่เป็นโอกาสในการสร้างรายได้ใหม่จากคลังเนื้อหาเก่า โดยไม่กระทบต่อธุรกิจหลัก

อย่างไรก็ตาม โครงการ Genesis ยังเผชิญความท้าทาย เช่น การรักษาความเป็นส่วนตัวของข้อมูลผู้ใช้ และการจัดการกับข้อมูลที่อาจมีความลำเอียงทางสังคมหรือการเมือง Scale AI ยืนยันว่าจะใช้กระบวนการตรวจสอบคุณภาพที่เข้มงวด เพื่อให้ชุดข้อมูลมีความสมดุลและปราศจากอคติ นอกจากนี้ ยังวางแผนขยายพันธมิตรเพิ่มเติมในอนาคต เพื่อให้ครอบคลุมข้อมูลจากภาคส่วนต่างๆ เช่น การแพทย์ การเงิน และการศึกษา

โดยสรุป Genesis ไม่เพียงแต่เป็นเครื่องมือสำหรับ Scale AI ในการครองตลาดข้อมูล AI แต่ยังเป็นยุทธศาสตร์ระดับชาติเพื่อรักษาความเป็นผู้นำของสหรัฐฯ ในยุค AI โครงการนี้คาดว่าจะเปลี่ยนโฉมอุตสาหกรรม โดยให้โมเดล AI ของอเมริกันมีข้อได้เปรียบจากข้อมูลภายในประเทศที่แข็งแกร่งและมีคุณภาพสูง ส่งผลให้เกิดนวัตกรรมที่ตอบโจทย์ผู้ใช้ชาวอเมริกันอย่างแท้จริง

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)