การบ่มเพาะ ai เอเจนติกให้ก้าวข้ามวัยท็อดเลอร์

พัฒนาเอไจเอนต์เอไอให้ก้าวข้ามวัยท้อทเลอร์สู่ขั้นตอนถัดไป

ในยุคที่ปัญญาประดิษฐ์ (เอไจี) กำลังก้าวหน้าอย่างรวดเร็ว ระบบเอไจเอนต์เอไอ ซึ่งเป็นเอไอที่สามารถดำเนินการด้วยตนเองได้อย่างอิสระ กำลังถูกเปรียบเทียบกับเด็กท้อทเลอร์ที่เต็มเปี่ยมไปด้วยศักยภาพ แต่ยังคงต้องการการดูแลอย่างใกล้ชิด ผู้เชี่ยวชาญในอุตสาหกรรมเห็นตรงกันว่า เอไจเอนต์เอไอในปัจจุบันยังอยู่ในวัยเริ่มต้น มีความสามารถที่น่าตื่นเต้นแต่ยังไม่น่าเชื่อถือพอสำหรับการใช้งานจริงในระดับองค์กร

เอไจเอนต์เอไอคือระบบที่สามารถวางแผน จัดการเครื่องมือภายนอก และดำเนินการหลายขั้นตอนเพื่อบรรลุเป้าหมายที่ซับซ้อน ต่างจากโมเดลภาษาขนาดใหญ่ (LLM) แบบดั้งเดิมที่ตอบสนองเพียงคำถามเท่านั้น ตัวอย่างที่โดดเด่นคือ Devin จาก Cognition Labs ซึ่งเป็นเอไจเอนต์เอไอที่ทำหน้าที่เป็นวิศวกรซอฟต์แวร์ สามารถแก้ไขบั๊ก จัดการโค้ด และนำเสนอผลงานได้ในระดับที่น่าประทับใจ Devin ได้รับการทดสอบบนแพลตฟอร์ม SWE-bench ซึ่งเป็นชุดข้อมูลมาตรฐานสำหรับงานวิศวกรรมซอฟต์แวร์ โดยทำผลงานได้ 13.86% ซึ่งสูงกว่าโมเดลโอเพ่นซอร์สอื่นๆ ถึงสองเท่า และสูงกว่าโมเดลจากบริษัทชั้นนำอย่าง OpenAI หรือ Google DeepMind ถึงสามเท่า

อย่างไรก็ตาม ความสำเร็จของ Devin ยังคงจำกัดอยู่ที่งานง่ายๆ และยังคงต้องการการแทรกแซงจากมนุษย์ในงานที่ซับซ้อน นักวิจัยจาก Cognition ยอมรับว่า Devin ยังคง “ยุ่งเหยิง” คล้ายเด็กท้อทเลอร์ที่อาจทำผิดพลาดได้ทุกเมื่อ Will Knight ผู้เขียนบทความจาก MIT Technology Review ชี้ให้เห็นว่า แม้เอไจเอนต์เอไอจะแสดงศักยภาพที่น่าตื่นเต้น แต่การนำไปใช้งานจริงยังคงเผชิญอุปสรรคใหญ่หลวง โดยเฉพาะในด้านความน่าเชื่อถือและความปลอดภัย

การทดสอบเอไจเอนต์เอไอในปัจจุบันเผยให้เห็นจุดอ่อนที่ชัดเจน บนเบนช์มาร์ก WebArena ซึ่งจำลองงานเว็บทั่วไป เช่น จองตั๋วเครื่องบินหรือจัดการอีเมล เอไจเอนต์ชั้นนำทำได้เพียง 14-20% ของงานทั้งหมด ในขณะที่มนุษย์สามารถทำได้เกือบ 100% เบนช์มาร์ก GAIA ซึ่งพัฒนาโดย Hugging Face, AutoGPT และ Meta วัดความสามารถในการแก้ปัญหาทั่วไป โดยเอไจเอนต์ชั้นนำทำได้เพียง 15-35% ในระดับปานกลาง ขณะที่มนุษย์ทำได้ 92% สถิติเหล่านี้บ่งชี้ว่าเอไจเอนต์เอไอเก่งในงานง่าย แต่ล้มเหลวในงานที่ต้องการการวางแผนหลายขั้นตอน การจัดการข้อมูลจำนวนมาก หรือการปรับตัวต่อสถานการณ์ไม่คาดฝัน

ผู้เชี่ยวชาญหลายท่านให้ความเห็นถึงสาเหตุของปัญหาเหล่านี้ Lilian Weng รองประธานฝ่ายงานวิจัยประยุกต์จาก OpenAI ระบุว่า ปัญหาหลักอยู่ที่การวางแผนระยะยาว (long-term planning) การใช้หน่วยความจำ (memory) และการจัดการเครื่องมือ (tool use) ซึ่งยังไม่สมบูรณ์แบบ โมเดลปัจจุบันมักหลงลืมข้อมูลสำคัญหรือตัดสินใจผิดพลาดเมื่อเผชิญกับข้อมูลขัดแย้ง Noam Brown หัวหน้าทีมเกมจาก OpenAI ชี้ว่า เอไจเอนต์เอไอขาด “reasoning” ที่แข็งแกร่งพอ โดยเฉพาะเมื่อต้องจัดการกับสถานการณ์ที่ไม่เคยพบมาก่อน

เพื่อก้าวข้ามขีดจำกัดนี้ บริษัทชั้นนำกำลังลงทุนในเทคโนโลยีใหม่ๆ Anthropic กำลังพัฒนาโมเดล Claude 3.5 Sonnet ที่มีเครื่องมือคอมพิวเตอร์ใช้ (computer-use tool) ซึ่งช่วยให้เอไจเอนต์สามารถควบคุมเมาส์ คีย์บอร์ด และหน้าจอได้คล้ายมนุษย์ OpenAI กำลังทดลอง o1 model ที่เน้นการคิดแบบ chain-of-thought เพื่อปรับปรุงการวางแผน Adept และบริษัทอื่นๆ มุ่งเน้นการสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อฝึกฝนเอไจเอนต์ในสถานการณ์หลากหลาย

การประเมินประสิทธิภาพ (evaluation) ก็เป็นประเด็นสำคัญ Karthik Valmeekam จาก NASA Ames Research Center เน้นยาว่า เบนช์มาร์กปัจจุบันไม่เพียงพอ เนื่องจากเอไจเอนต์สามารถ “โกง” ได้โดยการคัดลอกคำตอบจากข้อมูลฝึกฝน เขาเสนอให้ใช้สภาพแวดล้อมแบบไดนามิกที่เปลี่ยนแปลงตลอดเวลาเพื่อทดสอบความสามารถที่แท้จริง เช่น AgentBench หรือ τ-bench ที่จำลองการสนทนาระยะยาว

อนาคตของเอไจเอนต์เอไอคือการก้าวสู่ “วัยเด็ก” ที่น่าเชื่อถือมากขึ้น โดยต้องอาศัยข้อมูลฝึกฝนคุณภาพสูง การปรับปรุงสถาปัตยกรรม และการทดสอบที่เข้มงวดยิ่งขึ้น Alex Krantz รองประธานฝ่ายเอไจเอนต์จาก Harvey กล่าวว่า “เรากำลังอยู่ในยุคท้อทเลอร์ แต่กำลังมุ่งสู่การเป็นเด็กวัยรุ่น” การพัฒนานี้จะนำไปสู่ระบบที่สามารถทำงานอิสระในองค์กรได้ โดยลดการแทรกแซงจากมนุษย์ลงเหลือน้อยที่สุด

อย่างไรก็ตาม ความท้าทายยังคงมีมาก โดยเฉพาะด้านความปลอดภัยและจริยธรรม เอไจเอนต์ที่สามารถเข้าถึงเครื่องมือจริง เช่น ระบบธนาคารหรือโครงสร้างพื้นฐาน อาจก่อให้เกิดความเสี่ยงหากเกิดข้อผิดพลาด Stuart Russell นักวิจัยด้านเอไอชื่อดังเตือนว่า ต้องมีระบบกำกับดูแลที่แข็งแกร่งเพื่อป้องกันการกระทำที่ไม่พึงประสงค์

สรุปแล้ว การเลี้ยงดูเอไจเอนต์เอไอให้ก้าวข้ามวัยท้อทเลอร์ต้องอาศัยความร่วมมือระหว่างนักวิจัย บริษัทเทคโนโลยี และหน่วยงานกำกับดูแล เพื่อสร้างระบบที่ไม่เพียงฉลาด แต่ยังน่าเชื่อถือและปลอดภัย ด้วยความก้าวหน้าปัจจุบัน อนาคตที่เอไจเอนต์เอไอจะกลายเป็นผู้ช่วยที่ขาดไม่ได้ในธุรกิจใกล้เข้ามาแล้ว

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)