Kling 2.6 เพิ่มการควบคุมด้วยเสียงและการอัปเกรดการเคลื่อนไหว ขณะที่เครื่องมือวิดีโอ AI แข่งสู่ความสมจริง

Kling 2.6 เพิ่มฟีเจอร์ควบคุมด้วยเสียงและการอัปเกรดการเคลื่อนไหว ขณะที่เครื่องมือวิดีโอ AI แข่งขันสู่ความสมจริง

บริษัท Kuaishou จากจีนผู้พัฒนา Kling AI ได้เปิดตัวเวอร์ชัน Kling 2.6 ซึ่งเป็นการอัปเดตครั้งสำคัญที่มุ่งเน้นการเพิ่มฟีเจอร์ควบคุมด้วยเสียงและการปรับปรุงการเคลื่อนไหว เพื่อยกระดับความสมจริงของวิดีโอที่สร้างด้วยปัญญาประดิษฐ์ (AI) การอัปเดตนี้เกิดขึ้นท่ามกลางการแข่งขันดุเดือดในอุตสาหกรรมเครื่องมือวิดีโอ AI โดย Kling กำลังไล่ตามผู้นำอย่าง OpenAI’s Sora, Luma Dream Machine และ Runway ML ที่ต่างมุ่งสู่การสร้างวิดีโอที่ใกล้เคียงความเป็นจริงมากยิ่งขึ้น

ฟีเจอร์หลักที่โดดเด่นใน Kling 2.6 คือ Voice-Driven Animation ซึ่งช่วยให้ผู้ใช้สามารถควบคุมการแสดงออกของตัวละครผ่านการสั่งงานด้วยเสียง โดยระบบจะวิเคราะห์น้ำเสียง อารมณ์ และสำเนียง เพื่อสร้างการขยับปาก (lip sync) การเคลื่อนไหวของใบหน้า และการหมุนศีรษะที่สอดคล้องกันอย่างแม่นยำ ตัวอย่างเช่น ผู้ใช้สามารถบันทึกเสียงพูด แล้ว Kling จะแปลงเป็นวิดีโอตัวละครที่พูดตามน้ำเสียงนั้นได้อย่างเป็นธรรมชาติ โดยไม่ต้องพึ่งพาการพิมพ์ข้อความหรือการกำหนด animation แบบแมนนวล ฟีเจอร์นี้ช่วยลดขั้นตอนการผลิตเนื้อหา ทำให้เหมาะสำหรับการสร้างวิดีโอโปรโมชัน สอน หรือเนื้อหาความบันเทิงที่ต้องการการแสดงออกเฉพาะบุคคล

นอกจากนี้ Kling 2.6 ยังอัปเกรด Motion Brush 2.0 ซึ่งเป็นเครื่องมือควบคุมการเคลื่อนไหวแบบละเอียด โดยผู้ใช้สามารถ “วาด” หรือกำหนดทิศทางการเคลื่อนไหวเฉพาะจุดบนเฟรมภาพ เช่น การโบกมือ การเดิน หรือการกระโดด โดยระบบจะคำนวณฟิสิกส์และแรงโน้มถ่วงให้สมจริงยิ่งขึ้น การปรับปรุงนี้แก้ไขปัญหาการเคลื่อนไหวที่ดูแข็งทื่อในเวอร์ชันก่อนหน้า ทำให้ตัวละครและวัตถุเคลื่อนไหวราวกับอยู่ในโลกจริง เช่น การโยกตัวตามจังหวะเพลงหรือการโต้ตอบกับสิ่งแวดล้อมอย่างเป็นธรรมชาติ

ด้านการจำลองฟิสิกส์ Kling 2.6 ได้ปรับปรุงการคำนวณให้ซับซ้อนยิ่งขึ้น โดยเฉพาะการจัดการกับการชน การหมุน และการกระจายน้ำหนัก ทำให้วิดีโอมีมิติเชิงลึกมากกว่าเดิม ระบบรองรับความยาววิดีโอสูงสุดถึง 2 นาทีที่ความละเอียด 1080p และ 30 เฟรมต่อวินาที ซึ่งเป็นการขยายจากเวอร์ชันก่อนหน้าที่จำกัดอยู่ที่ 10 วินาที นอกจากนี้ ยังเพิ่ม Elements Mode สำหรับการแทรกองค์ประกอบพิเศษ เช่น ฝน ควัน หรือแสง เพื่อเสริมความสมจริงให้กับฉาก

ในการทดสอบเบนช์มาร์ก Kling 2.6 แสดงผลงานเหนือกว่าเวอร์ชัน 2.0 ในด้านความสมจริง โดยคะแนนเฉลี่ยสูงขึ้น 20-30% ในหมวดการเคลื่อนไหวและการแสดงออก ตัวอย่างเดโมที่ Kuaishou ปล่อยออกมาสร้างความประทับใจ เช่น วิดีโอตัวละครร้องเพลงที่ขยับปากและใบหน้าตามจังหวะอย่างแม่นยำ หรือฉากตัวละครเต้นที่ฟิสิกส์ร่างกายสมบูรณ์แบบ ผู้ใช้ในชุมชน AI เช่น Reddit และ Bilibili ได้ชื่นชมว่าฟีเจอร์ voice control ทำให้ Kling กลายเป็นเครื่องมือที่ใช้งานง่ายสำหรับครีเอเตอร์มือใหม่ ในขณะที่ motion upgrades ช่วยให้ผลลัพธ์ใกล้เคียงกับโปรดักชันภาพยนตร์ระดับมืออาชีพ

การอัปเดตนี้เกิดขึ้นหลังจาก Kling 2.0 ได้รับความนิยมอย่างล้นหลาม โดยมียอดผู้ใช้รายวันเกิน 1 ล้านคนภายในสัปดาห์แรกหลังเปิดตัว Kuaishou ซึ่งเป็นแพลตฟอร์มวิดีโอสั้นยักษ์ใหญ่ของจีน กำลังใช้ Kling เพื่อเสริมความสามารถในการผลิตคอนเทนต์ ซึ่งช่วยให้ผู้สร้างสามารถแข่งขันกับ TikTok และ YouTube ได้ดียิ่งขึ้น อย่างไรก็ตาม Kling ยังคงมีข้อจำกัด เช่น การรองรับเฉพาะภาษาจีนและอังกฤษใน voice control และปัญหาการประมวลผลที่ใช้เวลานานในโหมดความละเอียดสูง โดย Kuaishou วางแผนอัปเดตเพิ่มเติมเพื่อแก้ไขในอนาคต

เมื่อเปรียบเทียบกับคู่แข่ง Kling 2.6 ถือเป็นก้าวกระโดดสำคัญ Sora ของ OpenAI ยังคงนำในด้านความสมจริงโดยรวม แต่ Kling ชนะในฟีเจอร์ voice และ motion control ที่ใช้งานได้ทันที Luma Dream Machine 3.0 มีจุดเด่นด้าน physics simulation แต่ขาดการควบคุมด้วยเสียง ส่วน Runway Gen-3 เก่งเรื่อง text-to-video แต่ motion ยังไม่ละเอียดเท่า การแข่งขันนี้สะท้อนแนวโน้มอุตสาหกรรมที่เครื่องมือ AI กำลังมุ่งสู่ “real-time generation” และ “multi-modal input” เพื่อให้ผู้ใช้สร้างวิดีโอคุณภาพสูงได้โดยไม่ต้องมีทักษะด้าน VFX

Kling 2.6 กำลังเปลี่ยนโฉมอุตสาหกรรมการผลิตวิดีโอ โดยเฉพาะในภาคธุรกิจที่ต้องการเนื้อหา personalized เช่น โฆษณา VR content หรือ e-learning ด้วยการผสาน voice และ motion ที่ล้ำสมัย Kling ไม่เพียงยกระดับมาตรฐาน แต่ยังเปิดโอกาสให้ธุรกิจขนาดกลางและขนาดย่อมเข้าถึงเทคโนโลยีระดับสูงได้โดยตรง ผู้เชี่ยวชาญคาดการณ์ว่าภายในสิ้นปีนี้ AI video tools จะสามารถสร้างวิดีโอความยาว 5 นาทีที่ indistinguishable จาก footage จริง ซึ่ง Kling 2.6 เป็นสัญญาณบ่งชี้ถึงทิศทางนั้น

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)