โอเพนเอไอเพิ่มตัวละคร cameos และการต่อวีดีโอในตัวสร้าง Sora

การยกระดับขีดความสามารถของ Sora: การผสานรวมตัวละครและการเชื่อมต่อภาพวิดีโอ

OpenAI ได้ขยายขีดความสามารถของแบบจำลองการสร้างวิดีโอ (Video Generation Model) ที่มีชื่อว่า Sora ด้วยการเพิ่มคุณสมบัติใหม่ที่สำคัญสองประการ ได้แก่ “ตัวละครรับเชิญ” (Character Cameos) และ “การเชื่อมต่อภาพวิดีโอ” (Video Stitching) การพัฒนาเหล่านี้บ่งชี้ถึงความพยายามอย่างต่อเนื่องของบริษัทในการปรับปรุงความสม่ำเสมอขององค์ประกอบภาพ (Visual Consistency) และการขยายขอบเขตความคิดสร้างสรรค์ของผู้ใช้ในการผลิตเนื้อหาวิดีโอคุณภาพสูงผ่านปัญญาประดิษฐ์

การรับประกันความสม่ำเสมอของตัวละครผ่าน “ตัวละครรับเชิญ”

คุณสมบัติ “ตัวละครรับเชิญ” ได้รับการออกแบบมาเพื่อตอบสนองต่อความท้าทายที่สำคัญในระบบการสร้างวิดีโอด้วย AI ทั่วไป นั่นคือการรักษาความต่อเนื่องของตัวละครหรือวัตถุที่ปรากฏในฉากที่แตกต่างกัน หรือช่วงเวลาที่ยาวนานขึ้น ก่อนหน้านี้ แบบจำลองการสร้างวิดีโออาจประสบปัญหาในการรักษาลักษณะทางกายภาพ (Physical Attributes) รูปลักษณ์ (Appearance) และเครื่องแต่งกาย (Attire) ของตัวละครให้คงที่ตลอดทั้งคลิป ซึ่งอาจส่งผลให้เกิดความไม่สอดคล้อง (Inconsistencies) และลดความสมจริงของผลงาน

ด้วยการนำเสนอคุณสมบัติใหม่นี้ ผู้ใช้สามารถสร้างวิดีโอที่ตัวละครหรือองค์ประกอบหลักยังคงรูปลักษณ์เดิมอย่างแม่นยำแม้ว่าจะมีการเปลี่ยนแปลงฉาก มุมมองกล้อง หรือการกระทำ คุณสมบัติ “ตัวละครรับเชิญ” นี้ไม่เพียงแต่เพิ่มความสมจริงในวิดีโอที่สร้างขึ้นเท่านั้น แต่ยังช่วยเสริมขีดความสามารถของผู้สร้างในการสร้างเรื่องราวที่ซับซ้อนและยาวนานขึ้น โดยไม่ต้องกังวลว่าแบบจำลองจะ ‘ลืม’ ลักษณะของตัวละครที่ได้กำหนดไว้ในตอนต้น

การขยายขีดจำกัดเวลาด้วย “การเชื่อมต่อภาพวิดีโอ”

การสร้างวิดีโอที่ยาวนานอย่างสม่ำเสมอเป็นข้อจำกัดทางเทคนิคที่สำคัญในด้านการสังเคราะห์สื่อด้วย AI (AI-Synthesized Media) คุณสมบัติ “การเชื่อมต่อภาพวิดีโอ” (Video Stitching) ที่เพิ่มเข้ามาใหม่นี้ได้แก้ไขปัญหานี้โดยอนุญาตให้ผู้ใช้สามารถเชื่อมต่อคลิปวิดีโอที่สร้างโดย Sora หลายคลิปเข้าด้วยกันอย่างราบรื่น (Seamlessly)

ตามคำอธิบายคุณสมบัติเมื่อเร็วๆ นี้ ผู้ใช้สามารถป้อนคำสั่งพรอมต์ (Prompt) เพื่อให้ Sora สร้างวิดีโอตามความยาวที่กำหนด หากวิดีโอความยาวดังกล่าวเกินกว่าขีดจำกัดการสร้างวิดีโอเดี่ยวของแบบจำลอง Sora จะแบ่งวิดีโอนั้นออกเป็นหลายคลิปย่อยที่ต่อเนื่องกัน (Sub-Clips) และสร้างแต่ละส่วนแยกกัน หลังจากที่สร้างเสร็จสมบูรณ์แล้ว ระบบจะรวมคลิปย่อยเหล่านั้นเข้าเป็นวิดีโอที่ยาวและต่อเนื่องเพียงหนึ่งเดียว การปรับปรุงนี้เปิดโอกาสให้ผู้สร้างเนื้อหาสามารถหลุดออกจากข้อจำกัดด้านเวลาของคลิปเดี่ยว ทำให้สามารถสร้างฉากหรือลำดับเหตุการณ์ที่มีความยาวมากขึ้นโดยยังคงรักษาความต่อเนื่องของภาพและการเล่าเรื่อง

นัยยะทางธุรกิจและอนาคตของการสร้างสรรค์วิดีโอ

การเพิ่มคุณสมบัติเหล่านี้เป็นการตอกย้ำถึงตำแหน่งของ Sora ในฐานะเครื่องมือที่ทรงพลังและพร้อมใช้งานในเชิงพาณิชย์มากขึ้น ด้วยขีดความสามารถในการรักษาความสม่ำเสมอของตัวละครและการสร้างวิดีโอที่ยาวขึ้นอย่างง่ายดาย ทำให้ Sora กลายเป็นเครื่องมือที่สำคัญสำหรับมืออาชีพและองค์กรที่ต้องการผลิตเนื้อหาวิดีโอคุณภาพสูง เช่น สื่อการตลาด ภาพยนตร์สั้น หรือการจำลองสถานการณ์ โดยมีขั้นตอนการทำงาน (Workflow) ที่มีประสิทธิภาพ การแก้ไขความท้าทายเชิงเทคนิคเหล่านี้ได้แสดงให้เห็นถึงความมุ่งมั่นของ OpenAI ในการผลักดันขอบเขตของความเป็นไปได้ในการสร้างสื่อด้วยปัญญาประดิษฐ์

คุณสมบัติเหล่านี้แม้ว่าจะได้รับการอธิบายโดยใช้ภาษาที่ไม่เป็นทางการ เช่น “ตัวละครรับเชิญ” (เป็นภาษาที่ใช้ในการสื่อสารภายใน) แต่ผลกระทบทางเทคนิคของมันมีความสำคัญอย่างยิ่งต่อการพัฒนาโมเดลการสร้างเนื้อหาที่สมจริงและสามารถควบคุมได้มากขึ้น และจะส่งผลให้วงการอุตสาหกรรมการผลิตวิดีโอต้องปรับตัวเข้ากับเครื่องมือ AI ที่มีศักยภาพเพิ่มขึ้นเรื่อยๆ

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)