Luma เปิด API โมเดลสร้างภาพ Uni-1.1 ในราคาและคุณภาพเทียบเท่า OpenAI และ Google

ลูมาเปิดตัว API โมเดลสร้างภาพ Uni 1.1 ราคาและคุณภาพเทียบเท่า OpenAI และ Google

ลูมา เอไอ (Luma AI) บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ชั้นนำ ได้เปิดตัว API สาธารณะสำหรับโมเดลสร้างภาพ Uni 1.1 อย่างเป็นทางการ โดยโมเดลดังกล่าวเป็นโมเดลขนาด 10 พันล้านพารามิเตอร์ (10B parameters) ที่ใช้สถาปัตยกรรม Diffusion Transformer (DiT) ซึ่งได้รับการพัฒนาให้มีประสิทธิภาพสูงสุดในการสร้างภาพจากข้อความ (text-to-image) Uni 1.1 ครองอันดับหนึ่งบน leaderboard การสร้างภาพของ Artificial Analysis ซึ่งเป็นเกณฑ์มาตรฐานอิสระที่ประเมินคุณภาพภาพจากโมเดล AI ชั้นนำทั่วโลก โดยทำคะแนนเหนือกว่าโมเดลอย่าง OpenAI DALL-E 3, Google Imagen 3, Black Forest Labs FLUX.1 Pro และ Midjourney v6.1 ในทุกด้านหลัก เช่น การเรนเดอร์ข้อความ (text rendering) การแสดงสรีระมนุษย์ (anatomy) มือ (hands) สไตล์ศิลปะ (style) และคุณภาพโดยรวม (aesthetic)

คุณภาพของ Uni 1.1 โดดเด่นในด้านการสร้างภาพที่สมจริงและละเอียด โดยเฉพาะการจัดการข้อความที่ซับซ้อน ซึ่งเป็นจุดอ่อนของโมเดลคู่แข่งหลายตัว ตัวอย่างเช่น โมเดลสามารถสร้างภาพที่มีข้อความยาวหลายบรรทัดชัดเจนและถูกต้องตามพรอมต์ได้อย่างแม่นยำ นอกจากนี้ ยังเก่งในการแสดงรายละเอียดทางกายวิภาค เช่น นิ้วมือที่สมส่วนและท่าทางที่เป็นธรรมชาติ รวมถึงการเลียนแบบสไตล์ศิลปะหลากหลาย ตั้งแต่ภาพวาดแบบคลาสสิกไปจนถึงภาพถ่ายสมจริง Artificial Analysis ยืนยันว่า Uni 1.1 มีประสิทธิภาพเหนือกว่า DALL-E 3 ในด้าน text และ anatomy ขณะที่เทียบเท่าหรือดีกว่า Imagen 3 ในด้านอื่นๆ ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับนักพัฒนาและธุรกิจที่ต้องการภาพคุณภาพสูง

ด้านราคา Luma กำหนดโครงสร้างที่แข่งขันได้สูง โดยคิดค่าบริการที่ $0.08 ต่อภาพขนาดมาตรฐาน 1024x1024 พิกเซล และ $0.40 ต่อภาพคุณภาพสูง (High Quality: HQ) ซึ่งรองรับขนาดสูงสุด 4096x4096 พิกเซล ราคานี้เทียบเท่ากับผู้ให้บริการชั้นนำ เช่น OpenAI GPT-4o ที่ $0.035 ต่อภาพ 1024x1024 และ Google Imagen 3 ที่ $0.03 ต่อภาพ 1024x1024 (แต่ Imagen 3 ยังอยู่ในขั้นตอนการเข้าถึงแบบจำกัด) Luma ยังมีแพ็กเกจสำหรับภาพ HQ ที่ $0.40 ซึ่งเหมาะสำหรับการใช้งานที่ต้องการรายละเอียดสูง เช่น การพิมพ์หรือโฆษณา โดยรวมแล้ว ราคาของ Uni 1.1 ถือว่าคุ้มค่ากับคุณภาพชั้นนำ โดยเฉพาะเมื่อพิจารณาจากการครองอันดับหนึ่งบน leaderboard

API ของ Uni 1.1 รองรับฟีเจอร์ที่ครบครันสำหรับนักพัฒนา โดยมี endpoint หลัก 3 ตัว ได้แก่ Text-to-Image สำหรับสร้างภาพจากข้อความ Image-to-Image สำหรับแก้ไขหรือปรับแต่งภาพต้นฉบับ และ Upscale สำหรับขยายขนาดภาพให้คมชัดยิ่งขึ้น ผู้ใช้งานสามารถเข้าถึงผ่าน Luma API Console ที่ https://api.lumalabs.ai/v1 ซึ่งรองรับการใช้งานผ่าน REST API ด้วยคีย์ API ฟรีสำหรับทดลอง (rate limit 10 รีเควสต์ต่อนาที) และแพ็กเกจแบบจ่ายเงินสำหรับปริมาณการใช้งานสูง ลูมาเปิดให้ใช้งานทันทีโดยไม่ต้องรอคิว early access ซึ่งก่อนหน้านี้มีรายชื่อรอคอยกว่า 100,000 รายจากการประกาศเมื่อเดือนสิงหาคม

การเปิดตัว API นี้เกิดขึ้นท่ามกลางการแข่งขันที่ดุเดือดในตลาดโมเดลสร้างภาพ AI โดย Luma มุ่งเน้นการนำเสนอคุณภาพระดับแนวหน้าในราคาที่เข้าถึงได้ ช่วยให้นักพัฒนาและธุรกิจสามารถผสานรวม Uni 1.1 เข้ากับแอปพลิเคชันได้ง่าย เช่น แชทบอท เครื่องมือออกแบบกราฟิก หรือแพลตฟอร์ม e-commerce ที่ต้องการภาพสินค้าอัตโนมัติ ตัวอย่างผลงานจาก Uni 1.1 แสดงให้เห็นถึงความสามารถในการสร้างภาพที่หลากหลาย เช่น ภาพสัตว์ในสไตล์แฟนตาซี ภาพบุคคลในเครื่องแต่งกายประวัติศาสตร์ หรือภาพนามธรรมที่ซับซ้อน ซึ่งทั้งหมดมีคุณภาพเทียบเท่าโมเดล proprietary ชั้นนำ

Luma AI ก่อตั้งโดยอดีตวิศวกรจาก Meta และ Apple โดยมีจุดแข็งในด้านโมเดล 3D และวิดีโอ AI ก่อนหน้านี้ เช่น Dream Machine ที่สร้างคลิปวิดีโอจากข้อความ การขยายสู่ API สร้างภาพนี้ช่วยเสริมความแข็งแกร่งให้กับพอร์ตโฟลิโอ โดยเฉพาะในยุคที่ OpenAI และ Google เร่งพัฒนาโมเดลรุ่นใหม่ Luma ยังประกาศ roadmap สำหรับ Uni 2.0 ในอนาคต ซึ่งคาดว่าจะยกระดับประสิทธิภาพยิ่งขึ้น ผู้สนใจสามารถสมัครใช้งานได้ที่ https://lumalabs.ai/unify-api

การเปิดตัว Uni 1.1 API ถือเป็นก้าวสำคัญที่ทำให้ Luma กลายเป็นผู้เล่นหลักในตลาด API สร้างภาพ AI โดยนำเสนอสมดุลระหว่างคุณภาพ ราคา และความง่ายในการใช้งาน ซึ่งจะช่วยดึงดูดลูกค้าธุรกิจและนักพัฒนาจำนวนมากในช่วงที่ตลาดกำลังเติบโตอย่างรวดเร็ว

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)