ปริศนา Zelda พิสูจน์ว่าโมเดล AI สามารถแก้ปริศนาเกมที่ต้องคิดล่วงหน้าถึงหกก้าวได้

ปริศนา Zelda พิสูจน์ศักยภาพโมเดล AI ในการแก้ปัญหาเกมที่ต้องวางแผนล่วงหน้า 6 ก้าว

ในวงการปัญญาประดิษฐ์ (AI) การทดสอบความสามารถในการวางแผนและการใช้เหตุผลเชิงลึกยังคงเป็นประเด็นสำคัญที่นักวิจัยให้ความสนใจ ปริศนาจากเกม The Legend of Zelda: Tears of the Kingdom ได้กลายเป็นกรณีศึกษาที่น่าสนใจ โดยพิสูจน์ว่าโมเดลภาษาขนาดใหญ่ (Large Language Models: LLMs) บางตัวสามารถแก้ปัญหาที่ซับซ้อนซึ่งต้องคิดล่วงหน้าถึง 6 ก้าวได้สำเร็จ

ปริศนาดังกล่าวถูกโพสต์บน Reddit โดยผู้ใช้รายหนึ่งในชุมชน r/zelda ซึ่งเป็นปริศนาแบบ 2 มิติที่จำลองสถานการณ์ในเกม ผู้เล่นต้องผลักกล่องไม้ (wooden crates) ในลำดับที่ถูกต้องเพื่อให้ตัวละครสามารถเดินทางไปยังเป้าหมาย ซึ่งเป็นสัญลักษณ์ Triforce ได้ ปริศนานี้มีลักษณะเป็นกริดขนาดเล็ก โดยมีกำแพงกั้นและกล่องที่ต้องผลักในทิศทางเฉพาะเจาะจง หากผลักผิดลำดับ กล่องจะติดขัดและไม่สามารถแก้ไขได้

โครงสร้างของปริศนาประกอบด้วยกริด 5x5 ช่อง โดยมีตัวละครเริ่มต้นอยู่ที่มุมล่างซ้าย เป้าหมายอยู่ที่มุมขวาบน มีกล่องไม้ 4 ชิ้นวางในตำแหน่งที่ต้องผลักให้เข้าที่เพื่อสร้างทางเดิน กฎของปริศนาคือตัวละครสามารถเดินผ่านช่องว่างได้ แต่ไม่สามารถเดินผ่านกล่องหรือกำแพง และกล่องสามารถผลักได้เพียงทิศทางเดียวหากมีที่ว่างด้านหน้า การแก้ปริศนาต้องการการวางแผนลำดับการเคลื่อนที่ที่แม่นยำ โดยต้องคิดถึงผลกระทบของแต่ละก้าวต่อสถานะของกล่องทั้งหมด

นักวิจัยจาก The Decoder ได้นำปริศนานี้มาทดสอบกับโมเดล AI ชั้นนำหลายตัว เพื่อประเมินความสามารถในการแก้ปัญหาที่ต้องใช้การคิดเชิงลึก (deep reasoning) โดยให้คำสั่งแก่ AI ในการอธิบายขั้นตอนการแก้ปัญหาอย่างละเอียด โดยไม่ให้คำใบ้เพิ่มเติมในรอบแรก

ผลการทดสอบพบว่าโมเดล GPT-4o จาก OpenAI ล้มเหลวในการแก้ปัญหา แม้จะพยายามวางแผนหลายครั้ง แต่ก็ติดขัดที่การผลักกล่องในลำดับที่ผิดพลาด ส่งผลให้กล่องกีดขวางทางเดิน ในขณะที่ Claude 3.5 Sonnet จาก Anthropic สามารถแก้ปัญหาได้บางส่วนหลังจากได้รับคำใบ้ แต่ยังไม่สมบูรณ์แบบ อย่างไรก็ตาม โมเดล o1-preview จาก OpenAI ซึ่งเป็นโมเดลรุ่นใหม่ที่ออกแบบมาเพื่อการใช้เหตุผลเชิงลึก สามารถแก้ปัญหาได้สำเร็จในครั้งแรก โดยให้ลำดับการเคลื่อนที่ที่ถูกต้องครบถ้วน 6 ก้าว

ลำดับการแก้ปัญหาที่ o1-preview เสนอมีดังนี้:

  1. ผลักกล่องทางขวาล่างขึ้นไปทางเหนือหนึ่งช่อง เพื่อเปิดทางให้ตัวละครเคลื่อนที่

  2. เดินอ้อมไปทางขวาและผลักกล่องชิ้นที่สองทางตะวันออก เพื่อจัดตำแหน่งให้เหมาะสม

  3. ผลักกล่องชิ้นที่สามลงมาทางใต้ เพื่อสร้างสะพานข้ามช่องว่าง

  4. เคลื่อนตัวละครไปยังตำแหน่งกลางและผลักกล่องชิ้นสุดท้ายทางตะวันตกเฉียงเหนือ

  5. เดินผ่านทางที่เปิดขึ้นและผลักกล่องตัวสุดท้ายเพื่อล็อกตำแหน่ง

  6. เดินตรงไปยัง Triforce ที่มุมขวาบน

การที่ o1-preview สามารถวางแผนได้ถูกต้องทันที แสดงให้เห็นถึงความสามารถในการจำลองสถานะของปริศนาในจิตใจ (mental simulation) และคาดการณ์ผลลัพธ์หลายก้าวล่วงหน้า ซึ่งเป็นคุณสมบัติที่คล้ายคลึงกับการคิดของมนุษย์ในปัญหาเชิงตรรกะ

จากการทดสอบนี้ นักวิจัยชี้ให้เห็นว่าโมเดล AI รุ่นใหม่กำลังก้าวหน้าในการจัดการกับปัญหาที่ต้องใช้ “chain-of-thought” หรือการคิดแบบต่อเนื่อง โดย o1-preview ใช้เทคนิคการคิดภายใน (internal reasoning) ก่อนให้คำตอบ ซึ่งช่วยเพิ่มความแม่นยำในสถานการณ์ซับซ้อน ปริศนา Zelda นี้จึงเป็นตัวอย่างที่ชัดเจนว่า AI ไม่เพียงแค่ตอบคำถามง่ายๆ แต่สามารถรับมือกับปริศนาเกมที่ต้องการการวางแผนเชิงกลยุทธ์ได้

อย่างไรก็ตาม ผลการทดสอบยังเผยจุดอ่อนของโมเดลอื่นๆ เช่น GPT-4o ที่มักตกหลุมพรางของการคิดระยะสั้น โดยลืมพิจารณาผลกระทบระยะยาว นักวิจัยแนะนำว่าการทดสอบด้วยปริศนาแบบนี้ควรเป็นมาตรฐานในการประเมิน AI เพื่อวัดความสามารถจริงในการแก้ปัญหาในโลกจริง เช่น การวางแผนโลจิสติกส์หรือการจัดการทรัพยากร

ปริศนานี้ไม่เพียงพิสูจน์ศักยภาพของ AI ในด้านเกมมิ่ง แต่ยังบ่งชี้ถึงการประยุกต์ใช้ในอุตสาหกรรมต่างๆ เช่น การพัฒนาซอฟต์แวร์อัตโนมัติหรือระบบควบคุมอัจฉริยะที่ต้องคำนวณหลายขั้นตอน การทดสอบดังกล่าวช่วยยืนยันว่าเทคโนโลยี AI กำลังเข้าใกล้ขีดความสามารถของมนุษย์ในด้านการใช้เหตุผลเชิงลึกมากขึ้น

ในบริบททางธุรกิจ การนำ AI ที่มีความสามารถเช่นนี้มาใช้จะช่วยเพิ่มประสิทธิภาพในการแก้ปัญหาซับซ้อน ลดเวลาการทดลองผิดลองถูก และสนับสนุนการตัดสินใจที่แม่นยำยิ่งขึ้น โดยเฉพาะในภาคอุตสาหกรรมเกม เทคโนโลยี และการผลิต

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)