OpenAI รับเอาชั้นโครงสร้างทักษะแบบโมดูลาร์ของ Anthropic อย่างเงียบ ๆ เพื่อยกระดับความสามารถของเอเจนต์

OpenAI รับใช้กรอบทักษะโมดูลาร์ของ Anthropic อย่างเงียบ ๆ เพื่อเสริมศักยภาพเอเจนต์ปัญญาประดิษฐ์

OpenAI ได้นำกรอบทักษะโมดูลาร์ (Modular Skills Framework) ของ Anthropic มาใช้อย่างเงียบงัน เพื่อยกระดับขีดความสามารถของเอเจนต์ปัญญาประดิษฐ์ (AI Agents) ในตระกูลโมเดล o1 โดยเฉพาะ o1-preview และ o1-pro การค้นพบนี้มาจากการวิเคราะห์พรอมต์ระบบ (System Prompt) ของโมเดลดังกล่าว ซึ่งเผยให้เห็นถึงการผสานรวมแนวคิดจาก Anthropic เข้ากับระบบของ OpenAI โดยตรง

กรอบทักษะโมดูลาร์นี้เป็นแนวทางที่ช่วยให้เอเจนต์ AI สามารถแยกงานซับซ้อนออกเป็นทักษะย่อย ๆ ที่จัดการได้ง่ายขึ้น ซึ่ง Anthropic ได้พัฒนาและเปิดเผยแพร่เป็นโอเพ่นซอร์สก่อนหน้านี้ ช่วยให้โมเดลสามารถวางแผน จัดการเครื่องมือ และดำเนินการตามขั้นตอนได้อย่างมีประสิทธิภาพมากยิ่งขึ้น ในบริบทของ OpenAI การนำกรอบนี้มาใช้ช่วยเสริมความสามารถในการใช้งานคอมพิวเตอร์ (Computer Use) ซึ่งเป็นฟีเจอร์หลักของโมเดล o1 ที่ประกาศไปเมื่อเร็ว ๆ นี้ โดยเอเจนต์สามารถโต้ตอบกับเดสก์ท็อป เรียกใช้โปรแกรม และจัดการงานจริงได้ราวกับมนุษย์

พรอมต์ระบบที่เผยกลยุทธ์ของ OpenAI

จากการตรวจสอบพรอมต์ระบบของโมเดล o1 พบข้อความที่ชัดเจนว่า “คุณมีสิทธิ์เข้าถึงชุดทักษะโมดูลาร์ต่อไปนี้ที่คุณสามารถใช้เพื่อทำภารกิจให้สำเร็จ” (You have access to the following modular skills that you can use to accomplish tasks) ซึ่งคล้ายคลึงกับกรอบของ Anthropic อย่างมาก ทักษะเหล่านี้ถูกออกแบบให้เอเจนต์เลือกใช้ตามบริบทของงาน โดยไม่ต้องพึ่งพาการคิดแบบต่อเนื่อง (Chain-of-Thought) เพียงอย่างเดียว แต่เน้นการประกอบทักษะเข้าด้วยกันเพื่อผลลัพธ์ที่ซับซ้อน

ตัวอย่างทักษะหลักที่ปรากฏในพรอมต์ ได้แก่:

  • research: ใช้เบราว์เซอร์เพื่อค้นคว้าข้อมูลที่จำเป็นสำหรับงาน
  • plan: สร้างแผนการสำหรับงานที่ซับซ้อน โดยแบ่งเป็นขั้นตอนย่อย
  • code: เขียนและทดสอบโค้ดเพื่อแก้ปัญหาเฉพาะด้าน
  • test: ตรวจสอบและปรับปรุงผลลัพธ์จากการดำเนินการ
  • observe: สังเกตและวิเคราะห์สถานะปัจจุบันของระบบหรือสภาพแวดล้อม
  • act: ดำเนินการตามแผนโดยใช้เครื่องมือที่เหมาะสม

ทักษะเหล่านี้ช่วยให้เอเจนต์สามารถวนลูป (Loop) ระหว่างการวางแผน การสังเกต และการกระทำ ได้อย่างราบรื่น ซึ่งเป็นหัวใจของพฤติกรรมเอเจนต์ (Agentic Behavior) ที่ OpenAI กำลังผลักดัน

ความคล้ายคลึงกับกรอบของ Anthropic

Anthropic ได้เผยแพร่กรอบทักษะโมดูลาร์นี้ผ่านโครงการโอเพ่นซอร์ส โดยมุ่งเน้นการสร้าง “กราฟทักษะ” (Skills Graph) ที่เชื่อมโยงทักษะต่าง ๆ เข้าด้วยกัน ตัวอย่างเช่น ในโมเดล Claude ของ Anthropic ทักษะจะถูกเรียกใช้ผ่านพรอมต์ที่กำหนดบทบาทชัดเจน เช่น นักวิจัย นักวางแผน หรือโปรแกรมเมอร์ OpenAI ได้ปรับแต่งกรอบนี้ให้เข้ากับระบบของตน โดยเพิ่มการรองรับเครื่องมือใช้งานคอมพิวเตอร์ เช่น การคลิกเมาส์ พิมพ์คีย์บอร์ด และการนำทางหน้าจอ ซึ่งช่วยให้ o1 สามารถจัดการงานจริงในสภาพแวดล้อมดิจิทัลได้ดีขึ้น

การนำมาใช้อย่างเงียบงันนี้สะท้อนถึงกลยุทธ์ของ OpenAI ที่มักยืมแนวคิดจากคู่แข่งโดยไม่ประกาศอย่างเป็นทางการ คล้ายกับกรณีการพัฒนา “reasoning models” ที่ได้รับอิทธิพลจากแนวทางของคู่แข่งรายอื่น ๆ ผลลัพธ์คือ o1 สามารถจัดการงานที่ต้องการการโต้ตอบหลายขั้นตอนได้ดีกว่าโมเดลก่อนหน้า เช่น GPT-4o โดยเฉพาะในด้านการใช้เครื่องมือและการวางแผนระยะยาว

ผลกระทบต่อการพัฒนาเอเจนต์ AI

การผสานกรอบทักษะโมดูลาร์ช่วยยกระดับเอเจนต์ของ OpenAI ให้ใกล้เคียงกับวิสัยทัศน์ “AGI Agents” มากขึ้น โดยเอเจนต์เหล่านี้ไม่เพียงตอบคำถาม แต่สามารถดำเนินการอิสระเพื่อบรรลุเป้าหมายที่กำหนด เช่น การวิจัยตลาด การพัฒนาซอฟต์แวร์เบื้องต้น หรือการจัดการเอกสาร ใน o1-pro ซึ่งเป็นเวอร์ชันพรีเมียม ราคา 200 ดอลลาร์ต่อเดือน ความสามารถนี้ถูกขยายให้ครอบคลุมงานที่ซับซ้อนยิ่งขึ้น โดยลดข้อผิดพลาดจากการตัดสินใจแบบสุ่ม

อย่างไรก็ตาม การพึ่งพากรอบจาก Anthropic ยังคงเป็นจุดอ่อน หาก Anthropic พัฒนาต่อเนื่อง OpenAI อาจต้องเร่งปรับปรุงเพื่อรักษาความล้ำหน้า นอกจากนี้ ผู้เชี่ยวชาญยังชี้ว่าการใช้พรอมต์แบบนี้ช่วยลด “hallucination” (ข้อมูลเท็จ) โดยบังคับให้เอเจนต์ยึดตามทักษะที่กำหนดไว้ล่วงหน้า

มุมมองอนาคตของ OpenAI Agents

ด้วยการนำกรอบนี้มาใช้ OpenAI กำลังเร่งสู่ยุคเอเจนต์อัตโนมัติเต็มรูปแบบ ซึ่งอาจรวมเข้ากับ ChatGPT Enterprise หรือ API สำหรับธุรกิจ ในขณะที่ Anthropic ยังคงเป็นผู้นำด้านโอเพ่นซอร์ส OpenAI ใช้ประโยชน์จากแนวคิดเหล่านี้เพื่อแข่งขันในตลาดเอเจนต์ AI ที่กำลังขยายตัวอย่างรวดเร็ว การพัฒนานี้ยืนยันว่า การแข่งขันระหว่างยักษ์ใหญ่ AI ไม่ใช่แค่โมเดล แต่รวมถึงโครงสร้างเอเจนต์ที่รองรับการใช้งานจริงด้วย

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)