พนักงาน OpenAI บอกใบ้โมเดล Omni ใหม่

พนักงาน OpenAI บ่งชี้ถึงโมเดลใหม่ “Omni-Model” ที่กำลังพัฒนา

ในวงการปัญญาประดิษฐ์ (AI) ที่เต็มไปด้วยการแข่งขันอย่างดุเดือด OpenAI ผู้พัฒนาโมเดลภาษาขนาดใหญ่ที่โด่งดังอย่าง ChatGPT ได้รับความสนใจอย่างมากจากโพสต์ล่าสุดของพนักงานในทีมวิจัย ซึ่งบ่งชี้ถึงการฝึกโมเดลใหม่ที่เรียกว่า “omni-model” โมเดลดังกล่าวอาจเป็นก้าวสำคัญถัดไป หลังจากความสำเร็จของ GPT-4o ที่เปิดตัวไปเมื่อไม่นานมานี้

เสียงกระซิบจากทีมวิจัย OpenAI

เมื่อวันพุธที่ผ่านมา นาย Hongyu Ren นักวิจัยของ OpenAI ซึ่งทำงานในทีมพัฒนาโมเดล o1 ที่เน้นด้านการใช้เหตุผล ได้โพสต์ข้อความบนแพลตฟอร์ม X (เดิมคือ Twitter) ว่า “We are training an omni model :)” แม้จะเป็นข้อความสั้นๆ แต่กลับจุดประกายความสนใจจากชุมชน AI ทั่วโลก Ren เป็นหนึ่งในผู้เชี่ยวชาญหลักที่เกี่ยวข้องกับการพัฒนาโมเดล reasoning ทำให้โพสต์นี้มีน้ำหนักอย่างยิ่ง

ไม่กี่วันก่อนหน้านั้น นาย Joel Pobar นักวิจัยอีกคนจาก OpenAI ได้โพสต์เกี่ยวกับ “omni model that reasons” ซึ่งชี้ให้เห็นถึงศักยภาพของโมเดลใหม่นี้ในการรวมเอาความสามารถด้านการใช้เหตุผลเข้ากับคุณสมบัติแบบ “omni” หรือครอบคลุมทุกด้าน โพสต์เหล่านี้ไม่ได้เป็นการประกาศอย่างเป็นทางการ แต่ถือเป็นสัญญาณที่ชัดเจนจากภายในบริษัท ว่าทีมวิจัยกำลังมุ่งหน้าสู่การพัฒนาโมเดลรุ่นถัดไป

ความหมายของคำว่า “Omni” ในบริบทของ OpenAI

คำว่า “omni” ไม่ใช่คำใหม่สำหรับ OpenAI โดยโมเดล GPT-4o ที่เปิดตัวในเดือนพฤษภาคมปีนี้ ได้รับการตั้งชื่อเล่นภายในว่า “omni” เนื่องจากมีความสามารถแบบมัลติโมดัล (multimodal) ที่ครอบคลุมการประมวลผลข้อความ เสียง และภาพในเวลาเดียวกัน GPT-4o สามารถตอบสนองได้รวดเร็วและเป็นธรรมชาติยิ่งขึ้น โดยเฉพาะในด้านการสนทนาที่มีเสียงและวิเคราะห์ภาพ ซึ่งเป็นจุดเด่นที่เหนือกว่าโมเดลก่อนหน้า

การที่พนักงานใช้คำว่า “omni-model” ซ้ำอีกครั้ง บ่งชี้ว่าโมเดลใหม่นี้อาจเป็นการต่อยอดจาก GPT-4o โดยเพิ่มประสิทธิภาพในด้านอื่นๆ เช่น การใช้เหตุผลขั้นสูง (reasoning) ที่คล้ายกับโมเดล o1-preview และ o1-mini ที่เพิ่งเปิดตัว โมเดลเหล่านี้แสดงให้เห็นถึงความก้าวหน้าของ OpenAI ในการจัดการปัญหาที่ซับซ้อน โดยใช้เทคนิค chain-of-thought prompting เพื่อจำลองกระบวนการคิดแบบมนุษย์

บริบทการพัฒนาโมเดลล่าสุดของ OpenAI

OpenAI ได้เร่งพัฒนาโมเดลใหม่ๆ อย่างต่อเนื่องในช่วงปีที่ผ่านมา หลังจาก GPT-4o ยังคงมี GPT-4o mini ซึ่งเป็นเวอร์ชันขนาดเล็กที่ประหยัดต้นทุนมากขึ้น และโมเดล o1 ที่เน้น reasoning สำหรับงานวิทยาศาสตร์และคณิตศาสตร์ การฝึก “omni-model” อาจเป็นการรวมจุดเด่นทั้งหมดเข้าด้วยกัน เพื่อสร้างโมเดลที่ทรงพลังยิ่งขึ้น โดยเฉพาะในยุคที่คู่แข่งอย่าง Google DeepMind และ Anthropic กำลังไล่ตามอย่างใกล้ชิด

จากโพสต์ของ Ren และ Pobar สามารถสันนิษฐานได้ว่าโมเดลใหม่นี้กำลังอยู่ในขั้นตอนการฝึก (training) ซึ่งเป็นกระบวนการที่ใช้ทรัพยากรคอมพิวเตอร์มหาศาลและข้อมูลขนาดใหญ่ การฝึกโมเดล multimodal ต้องอาศัยการประสานข้อมูลจากหลายแหล่ง เช่น ข้อความ เสียง และภาพ เพื่อให้โมเดลเข้าใจและสร้างสรรค์ผลลัพธ์ที่เชื่อมโยงกันได้อย่างราบรื่น

ผลกระทบต่ออุตสาหกรรม AI

หาก “omni-model” นี้เป็นจริง มันอาจเปลี่ยนแปลงวิธีที่ธุรกิจและผู้พัฒนาใช้ AI ในปัจจุบัน โดยเฉพาะในแอปพลิเคชันที่ต้องการการตอบสนองแบบเรียลไทม์ เช่น ผู้ช่วยส่วนตัวอัจฉริยะ หุ่นยนต์ หรือระบบวิเคราะห์ข้อมูลเชิงลึก OpenAI ยังคงรักษาความลับเกี่ยวกับกำหนดการเปิดตัว แต่จากประวัติศาสตร์ของบริษัท โมเดลใหญ่ๆ มักเปิดตัวในช่วงปลายปีหรือต้นปีถัดไป

นอกจากนี้ โพสต์เหล่านี้ยังสะท้อนถึงวัฒนธรรมภายใน OpenAI ที่พนักงานสามารถแบ่งปันข้อมูลเบื้องต้นได้อย่างอิสระ ซึ่งช่วยสร้างความตื่นเต้นและดึงดูดบุคลากรชั้นนำเข้าสู่บริษัท สิ่งนี้เป็นกลยุทธ์สำคัญในสงคราม talent ของวงการ AI

สรุปแนวโน้มอนาคต

การบ่งชี้จากพนักงาน OpenAI ชี้ให้เห็นถึงการมุ่งสู่โมเดลที่ครอบคลุมยิ่งขึ้น โดยผสาน multimodal และ reasoning เข้าด้วยกัน นี่คือสัญญาณว่าอนาคตของ AI จะไม่ใช่แค่การตอบคำถาม แต่เป็นการแก้ปัญหาที่ซับซ้อนในทุกมิติ ผู้สนใจในเทคโนโลยี AI ควรติดตามพัฒนาการอย่างใกล้ชิด เนื่องจากอาจนำไปสู่การปฏิวัติครั้งใหม่ในอุตสาหกรรม

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)