Gen-4.5 ของ Runway แซงหน้า Google และ OpenAI ในเกณฑ์ทดสอบ text-to-video

รุ่น Gen-4-5 ของ Runway ขึ้นแท่นอันดับหนึ่งในเกณฑ์ทดสอบข้อความสู่วิดีโอ แซงหน้าตัวอย่างจาก Google และ OpenAI

บริษัท Runway ผู้พัฒนาเทคโนโลยีปัญญาประดิษฐ์ (AI) ชั้นนำ ได้เปิดตัวรุ่น Gen-4-5 ซึ่งเป็นโมเดลสร้างวิดีโอจากข้อความ (Text-to-Video) ล่าสุด โดยสามารถก้าวขึ้นสู่อันดับหนึ่งใน GenAI Video Arena benchmark ซึ่งเป็นเกณฑ์ทดสอบที่ได้รับการยอมรับในวงการ ผลการทดสอบล่าสุดแสดงให้เห็นว่า Gen-4-5 สามารถเอาชนะ Veo 2 ของ Google และ Sora ของ OpenAI ได้อย่างสูสี โดยทำคะแนน ELO สูงถึง 92.5 ซึ่งถือเป็นคะแนนสูงสุดเท่าที่เคยมีมา

GenAI Video Arena เป็น leaderboard ที่พัฒนาโดย Artificial Analysis ซึ่งเป็นหน่วยงานอิสระที่เชี่ยวชาญด้านการวิเคราะห์และเปรียบเทียบประสิทธิภาพของโมเดล AI สร้างวิดีโอ เกณฑ์ทดสอบนี้ใช้ระบบการให้คะแนนแบบ Elo rating system ซึ่งคล้ายกับระบบจัดอันดับในกีฬาเชส โดยอาศัยการเปรียบเทียบแบบ blind test จากผู้เชี่ยวชาญและผู้ใช้จำนวนมากกว่า 5,000 คน คะแนนจะพิจารณาจากปัจจัยหลักหลายประการ ได้แก่ คุณภาพภาพ (Visual Quality) คุณภาพการเคลื่อนไหว (Motion Quality) ความสมจริง (Realism) ความสอดคล้องกับพรอมต์ข้อความ (Prompt Adherence) และความชัดเจนโดยรวม (Overall Clarity) การทดสอบนี้ช่วยให้สามารถวัดผลได้อย่างเป็นกลาง โดยไม่เปิดเผยชื่อโมเดลระหว่างการประเมิน

จากผลการจัดอันดับล่าสุด Gen-4-5 ของ Runway ครองอันดับหนึ่งด้วยคะแนน 92.5 รองลงมาคือ Veo 2 ของ Google ที่คะแนน 90.3 และ Sora ของ OpenAI ที่ 89.7 คะแนนเหล่านี้ถือเป็นการก้าวกระโดดครั้งสำคัญ เนื่องจาก Gen-4-5 เป็นโมเดลแรกที่สามารถทำคะแนนทะลุ 90 อย่างสม่ำเสมอในทุกมิติ โดยก่อนหน้านี้ Veo 2 เคยครองอันดับหนึ่งอยู่พักหนึ่ง แต่ถูกแซงโดย Gen-4-5 ในการอัปเดตล่าสุด นอกจากนี้ รุ่นก่อนหน้าของ Runway อย่าง Gen-4 ยังคงอยู่อันดับสามด้วยคะแนน 89.2 ซึ่งแสดงถึงการพัฒนาอย่างต่อเนื่องของทีมงาน Runway

คุณสมบัติเด่นของ Gen-4-5 อยู่ที่ความสามารถในการสร้างวิดีโอที่มีความสอดคล้องและสมจริงสูงขึ้นอย่างเห็นได้ชัด Runway อธิบายว่าโมเดลนี้ได้รับการปรับปรุงจากข้อมูลฝึกฝนจำนวนมหาศาล ทำให้สามารถจัดการกับพรอมต์ข้อความที่ซับซ้อนได้ดีกว่าเดิม เช่น การสร้างฉากที่มีการเคลื่อนไหวแบบไดนามิก การเปลี่ยนมุมกล้องที่ราบรื่น และรายละเอียดทางกายภาพที่สมจริงยิ่งขึ้น ผู้ใช้สามารถสร้างวิดีโอความยาวสูงสุด 20 วินาทีที่ความละเอียด 1280x720 พิกเซล ในอัตราส่วนเฟรม 24 fps ซึ่งเหมาะสำหรับการใช้งานในอุตสาหกรรมบันเทิง การโฆษณา และการผลิตคอนเทนต์ดิจิทัล

ในแง่การเปรียบเทียบกับคู่แข่ง Veo 2 ของ Google โดดเด่นในด้านคุณภาพภาพและความสมจริง แต่ยังมีจุดอ่อนในเรื่องความสอดคล้องกับพรอมต์บางครั้ง ส่วน Sora ของ OpenAI ได้รับการยกย่องในด้านการเคลื่อนไหวที่เป็นธรรมชาติ แต่คะแนนโดยรวมยังตามหลัง Runway อยู่เล็กน้อย การที่ Gen-4-5 สามารถเอาชนะทั้งสองโมเดลนี้ได้ สะท้อนถึงความก้าวหน้าของ Runway ในการแข่งขันตลาด Text-to-Video ซึ่งเป็นหนึ่งในสาขาที่เติบโตเร็วที่สุดในวงการ AI โดยมีมูลค่าตลาดคาดการณ์ว่าจะพุ่งสูงในอีกไม่กี่ปีข้างหน้า

ปัจจุบัน Gen-4-5 มีให้บริการสำหรับสมาชิกแบบเสียค่าใช้จ่าย (Paid Subscribers) และผ่านทาง API สำหรับนักพัฒนา โดย Runway กำหนดโควตาการใช้งานรายเดือนตามแพ็กเกจ เช่น Enterprise plan ที่รองรับการใช้งานหนักหน่วง นอกจากนี้ Runway ยังเปิดตัว Gen-4-5 Turbo ซึ่งเป็นเวอร์ชันที่เร็วกว่าแต่ยังคงรักษาคุณภาพไว้ได้ใกล้เคียงกัน เพื่อตอบโจทย์ผู้ใช้ที่ต้องการความรวดเร็วในการผลิตคอนเทนต์

การขึ้นสู่อันดับหนึ่งครั้งนี้ไม่เพียงแต่ยืนยันศักยภาพของ Runway ในฐานะผู้นำเทคโนโลยี AI สร้างวิดีโอเท่านั้น แต่ยังเป็นสัญญาณบ่งชี้ถึงการแข่งขันที่ดุเดือดในอุตสาหกรรม โดยบริษัทอย่าง Google และ OpenAI กำลังเร่งพัฒนาโมเดลรุ่นใหม่เพื่อแย่งชิงตำแหน่งกลับคืน ผู้ประกอบการธุรกิจที่สนใจนำเทคโนโลยีนี้ไปใช้ ควรพิจารณาปัจจัยด้านความพร้อมใช้งาน ค่าใช้จ่าย และการบูรรวมกับระบบที่มีอยู่ เพื่อให้ได้ประโยชน์สูงสุดจากนวัตกรรมดังกล่าว

Runway ยังคงมุ่งมั่นในการพัฒนาต่อไป โดยทีมงานระบุว่าจะมีการอัปเดตเพิ่มเติมในอนาคตอันใกล้ เพื่อยกระดับประสิทธิภาพให้สูงยิ่งขึ้น ส่งผลให้ Gen-4-5 ไม่ใช่แค่ชัยชนะชั่วคราว แต่เป็นจุดเริ่มต้นของยุคใหม่ใน Text-to-Video generation ที่มีความสมจริงและใช้งานได้จริงมากขึ้น

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)