Seed 2.0 ของไบต์แดนซ์ เพิ่มแรงกดดันด้านราคามากยิ่งขึ้นต่อโมเดล AI ฝั่งตะวันตก

Seed 2.0 ของ ByteDance เพิ่มแรงกดดันด้านราคาให้กับโมเดล AI ตะวันตกมากยิ่งขึ้น

ByteDance บริษัทเทคโนโลยีชั้นนำจากจีน ได้เปิดตัว Seed 2.0 ซึ่งเป็นโมเดลสร้างภาพจากข้อความ (text-to-image model) แบบโอเพ่นซอร์สที่สามารถผลิตภาพได้ในเวลาไม่ถึงหนึ่งวินาที โมเดลนี้ไม่เพียงแต่มีประสิทธิภาพเหนือกว่าโมเดลแบบปิด (closed-source) หลายตัวในเกณฑ์ประเมินมาตรฐาน แต่ยังมีต้นทุนการใช้งานที่ต่ำมาก สร้างแรงกดดันด้านราคาอย่างหนักให้กับผู้ให้บริการโมเดล AI จากตะวันตก

Seed 2.0 มาพร้อมกับสองขนาด ได้แก่ โมเดลขนาด 1.5 พันล้านพารามิเตอร์ และโมเดลขนาด 3.5 พันล้านพารามิเตอร์ โดยโมเดลขนาดใหญ่ทำคะแนนในเกณฑ์ GenEval ได้ถึง 3.02 สูงกว่า Stable Diffusion XL (SDXL) ที่ได้ 2.45 และ PixArt-Alpha ที่ได้ 2.85 นอกจากนี้ ยังมีผลงานโดดเด่นในเกณฑ์ PartiPrompts และ DrawBench-Pixelated-Gen (DPG) ซึ่งเป็นการทดสอบความสามารถในการสร้างภาพจากคำอธิบายข้อความที่ซับซ้อน โมเดลนี้ถูกฝึกฝนด้วยชุดข้อมูลขนาด 45 ล้านภาพ โดยใช้เทคนิค Latent Consistency Distillation (LCD) ซึ่งช่วยให้การสร้างภาพรวดเร็วและมีคุณภาพสูง

ด้านความเร็วในการอนุมาน (inference) Seed 2.0 แสดงศักยภาพที่เหนือชั้น โดยโมเดลขนาดเล็กใช้เวลาเพียง 0.6 วินาที ขณะที่โมเดลขนาดใหญ่ใช้เวลา 1.2 วินาที บนการ์ดจีพียู NVIDIA A100 ซึ่งเร็วกว่าโมเดลคู่แข่งหลายตัว เช่น SDXL Turbo ที่ใช้เวลา 0.2 วินาทีแต่มีคุณภาพต่ำกว่า หรือ Stable Video Diffusion ที่ช้ากว่าในด้านการสร้างภาพนิ่ง ต้นทุนการใช้งานต่ำเป็นจุดเด่นสำคัญ โดยคำนวณจากราคา H100 GPU บนคลาวด์ ค่าใช้จ่ายต่อภาพอยู่ที่ประมาณ 2 เซ็นต์ (ประมาณ 0.70 บาท) ซึ่งต่ำกว่ามาตรฐานอุตสาหกรรมอย่างมาก

เมื่อเปรียบเทียบกับโมเดลตะวันตก Seed 2.0 สร้างความท้าทายด้านราคาที่รุนแรง Midjourney ซึ่งเป็นบริการยอดนิยม เรียกเก็บค่าบริการขั้นต่ำ 10 ดอลลาร์สหรัฐต่อเดือน (ประมาณ 350 บาท) สำหรับแผนพื้นฐาน ในขณะที่ DALL-E 3 จาก OpenAI ต้องสมัคร ChatGPT Plus ในราคา 20 ดอลลาร์สหรัฐต่อเดือน (ประมาณ 700 บาท) หรือหากใช้งานผ่าน API ของ GPT-4o ต้นทุนต่อภาพอยู่ที่ 0.04 ดอลลาร์สหรัฐ (ประมาณ 1.40 บาท) ซึ่งสูงกว่า Seed 2.0 ถึง 20 เท่า แม้แต่บริการฟรีอย่าง Grok จาก xAI ก็มีข้อจำกัดด้านจำนวนภาพและคุณภาพที่ด้อยกว่าในบางเกณฑ์

ประสิทธิภาพของ Seed 2.0 ยังครอบคลุมการสร้างภาพหลากหลายสไตล์ ตั้งแต่ภาพสมจริง (photorealistic) ไปจนถึงภาพศิลปะ (artistic) โดยไม่ต้องปรับแต่งเพิ่มเติมมากนัก ผู้พัฒนาสามารถดาวน์โหลดโมเดลจาก Hugging Face ได้ทันที และนำไปใช้งานบนฮาร์ดแวร์ทั่วไปโดยไม่ต้องพึ่งพาบริการคลาวด์ราคาแพง ByteDance เน้นย้ำว่า โมเดลนี้พัฒนาขึ้นเพื่อลดอุปสรรคในการเข้าถึงเทคโนโลยี AI generative สำหรับนักพัฒนาและธุรกิจขนาดเล็ก ซึ่งเป็นกลยุทธ์ที่ช่วยให้บริษัทจีนก้าวขึ้นเป็นผู้นำในตลาดโมเดลโอเพ่นซอร์ส

แรงกดดันนี้ไม่ใช่ครั้งแรกจาก ByteDance ก่อนหน้านี้ Seed 1.0 ได้รับการยกย่องว่ามีความสมดุลระหว่างคุณภาพและความเร็วเหนือกว่าโมเดลอื่นๆ ในระดับพารามิเตอร์ใกล้เคียงกัน การอัปเกรดเป็น Seed 2.0 ยิ่งตอกย้ำจุดแข็ง โดยเฉพาะในยุคที่ต้นทุนการฝึกโมเดล AI พุ่งสูงขึ้น ผู้ให้บริการตะวันตกอย่าง OpenAI และ Stability AI ต้องเผชิญกับการแข่งขันที่ดุเดือดมากขึ้น เนื่องจากโมเดลโอเพ่นซอร์สจากจีนสามารถนำไปปรับใช้ได้ฟรี สร้าง ecosystem ที่แข็งแกร่ง

อย่างไรก็ตาม ผู้ใช้งานควรทราบถึงข้อจำกัดบางประการ Seed 2.0 ถูกฝึกด้วยข้อมูลที่อาจมีอคติจากแหล่งกำเนิดจีน และอาจมีข้อกำหนดด้านลิขสิทธิ์หรือการใช้งานเชิงพาณิชย์ที่ต้องตรวจสอบ นอกจากนี้ แม้จะเป็นโอเพ่นซอร์ส แต่การเข้าถึงบางส่วนอาจถูกจำกัดในบางภูมิภาคเนื่องจากนโยบายทางการค้า

โดยรวมแล้ว Seed 2.0 ไม่เพียงเป็นก้าวกระโดดทางเทคนิค แต่ยังเป็นตัวเร่งให้เกิดการเปลี่ยนแปลงโครงสร้างตลาด AI generative สู่ทิศทางที่ราคาถูกลงและเข้าถึงได้มากขึ้น ธุรกิจที่กำลังมองหาโซลูชันสร้างภาพอัตโนมัติควรพิจารณาโมเดลนี้เพื่อลดต้นทุนและเพิ่มประสิทธิภาพในการดำเนินงาน

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)