การศึกษาล่าสุดของ Anthropic ชี้ว่า AI ยังห่างไกลจากศักยภาพการ disruption งานตามทฤษฎี
Anthropic บริษัทผู้พัฒนาโมเดลภาษาขนาดใหญ่ชั้นนำ ได้เผยแพร่งานวิจัยฉบับใหม่ที่ชื่อว่า “AI Automation and Labor Market Outcomes” ซึ่งประเมินศักยภาพของโมเดล AI ปัจจุบันในการ disrupt ตลาดแรงงาน โดยมุ่งเน้นไปที่การประเมินประสิทธิภาพของ Claude 3.5 Sonnet ซึ่งเป็นโมเดลภาษาล่าสุดของบริษัทในการปฏิบัติงานจริงในหลากหลายอาชีพ งานวิจัยนี้ใช้ฐานข้อมูล O*NET ซึ่งมีข้อมูลอาชีพ 1,018 อาชีพ และกิจกรรมการทำงานกว่า 19,000 กิจกรรม เพื่อสร้างงานทดสอบที่สมจริง โดยผู้เชี่ยวชาญในแต่ละสาขาได้ช่วยร่างโจทย์ 10 ข้อต่ออาชีพหนึ่งอาชีพ
วิธีการศึกษานี้แตกต่างจากงานวิจัยก่อนหน้าที่มักประเมินจากคำอธิบายงานแบบกว้างๆ โดย Anthropic เลือกใช้ “งานทดสอบเฉพาะเจาะจง” (specific work tasks) ที่สะท้อนกิจกรรมจริงในที่ทำงาน เช่น การวิเคราะห์ข้อมูลทางการเงิน การวางแผนโครงการ หรือการตอบคำถามลูกค้า ผู้เชี่ยวชาญที่เป็นมนุษย์ทำหน้าที่เป็นผู้ประเมิน โดยให้คะแนนประสิทธิภาพของ AI เทียบกับมนุษย์ในระดับเดียวกัน โดยพิจารณาว่า AI สามารถ “แทนที่ได้เต็มที่” (fully automatable) เมื่อทำงานได้ดีกว่ามนุษย์ 80% ขึ้นไป “ช่วยเหลือได้บางส่วน” (partially automatable) เมื่อได้คะแนน 20-80% และ “ไม่สามารถแทนที่ได้” (non-automatable) เมื่อต่ำกว่า 20%
ผลการศึกษาพบว่า Claude 3.5 Sonnet สามารถแทนที่กิจกรรมการทำงานได้เต็มที่เพียง 0.71% ของทั้งหมด ในขณะที่ช่วยเหลือได้บางส่วนอีก 5.3% ซึ่งหมายความว่า AI ปัจจุบันยัง automate งานได้น้อยมากเมื่อเทียบกับศักยภาพทางทฤษฎีที่คาดการณ์ไว้ ในอาชีพที่มีการ expose ต่อ AI สูงสุด 10% (เช่น นักวิเคราะห์ข้อมูล นักเขียนโค้ด หรือนักกฎหมาย) AI สามารถแทนที่เวลาในการทำงานได้ไม่เกิน 7% เท่านั้น แม้ในกลุ่มอาชีพเหล่านี้ AI ก็ยังไม่สามารถ disrupt ได้อย่างมีนัยสำคัญ
กราฟผลการศึกษายืนยันแนวโน้มนี้ โดยการกระจายของกิจกรรมที่ AI ทำงานได้ดีนั้นจำกัดอยู่ที่ส่วนท้ายของหางกระจาย (long tail) เฉพาะบางงาน เช่น การสรุปเอกสารหรือการตอบคำถามพื้นฐาน แต่ในงานที่ซับซ้อน เช่น การเจรจาต่อรอง การวางกลยุทธ์ หรือการแก้ปัญหาที่ไม่คาดคิด AI ยังด้อยกว่ามนุษย์อย่างชัดเจน นอกจากนี้ งานวิจัยยังเปรียบเทียบกับการศึกษาก่อนหน้าของ Epoch AI ซึ่งคาดการณ์ว่า AI จะ automate งานได้ 20-60% แต่ผลจริงของ Anthropic ต่ำกว่ามาก เนื่องจากโมเดลทฤษฎีมักสมมติว่า AI มีประสิทธิภาพเหนือมนุษย์ (superhuman) ในทุกงานที่ expose แต่ความเป็นจริง AI ยังคงมีช่องว่างใหญ่หลวง
ตัวอย่างผลการทดสอบเฉพาะเจาะจง เช่น ในอาชีพนักบัญชี AI ทำได้ดีในการคำนวณงบดุล แต่ล้มเหลวในการตีความบริบททางธุรกิจที่ซับซ้อน ในอาชีพวิศวกรซอฟต์แวร์ AI สามารถเขียนโค้ดพื้นฐานได้ แต่ไม่สามารถ debug ระบบขนาดใหญ่หรือออกแบบสถาปัตยกรรมที่ยั่งยืนได้ การศึกษายังชี้ว่า แม้ AI จะเก่งในงานที่ใช้ภาษาและเหตุผลเชิงตรรกะ แต่ยังอ่อนแอในงานที่ต้องใช้การรับรู้ทางกายภาพ การโต้ตอบทางสังคม หรือความรู้เฉพาะทางที่ลึกซึ้ง
มุมมองของ Anthropic เน้นย้ำว่า การ disrupt ตลาดแรงงานตามทฤษฎี เช่น รายงานของ Goldman Sachs ที่คาดการณ์การสูญเสียงาน 300 ล้านตำแหน่ง ยังคงเป็นเพียงสมมติฐานที่เกินจริง เนื่องจาก AI ยังไม่บรรลุระดับ superhuman ในงานส่วนใหญ่ แม้การ scaling compute และข้อมูลจะช่วยยกระดับประสิทธิภาพ แต่ช่องว่างปัจจุบันยังกว้างขวาง โดยเฉพาะใน 90% ของกิจกรรมการทำงานที่ AI expose น้อยหรือทำงานได้ไม่ดีพอ
งานวิจัยนี้มีนัยสำคัญต่อนโยบายเศรษฐกิจและการวางแผนกำลังคน โดยชี้ให้เห็นว่า AI จะไม่ก่อให้เกิดการเปลี่ยนแปลงครั้งใหญ่ในระยะสั้น แต่ค่อยๆ เติบโตในงานเฉพาะทาง นายจ้างควรเน้นการฝึกอบรมพนักงานให้ใช้ AI เป็นเครื่องมือช่วยเหลือ แทนที่จะกลัวการแทนที่ทั้งหมด นอกจากนี้ ยังเปิดโอกาสให้รัฐบาลและองค์กรธุรกิจวางกลยุทธ์รับมือที่สมดุลมากขึ้น โดยไม่ต้องตื่นตระหนกกับวิกฤต失业ที่อาจไม่เกิดขึ้นในเร็ววัน
สรุปแล้ว การศึกษาของ Anthropic ยืนยันว่า AI ยังคงอยู่ในระยะ “ช่วยเหลือ” (augmentation) มากกว่า “แทนที่” (replacement) และศักยภาพ disruption จริงยังห่างไกลจากแบบจำลองทฤษฎี ซึ่งช่วยให้เกิดมุมมองที่สมจริงยิ่งขึ้นในการเตรียมพร้อมสำหรับอนาคตแรงงาน
(จำนวนคำประมาณ 728 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)