เทเรนซ์ เทา นักคณิตศาสตร์รางวัลฟิลด์ส เมดัล เผยว่า ChatGPT 5.5 Pro สร้างงานวิจัยคณิตศาสตร์ระดับดุษฎีบัณฑิตได้ในเวลาน้อยกว่า 2 ชั่วโมง โดยไม่ต้องอาศัยความช่วยเหลือจากมนุษย์
ในโพสต์บนแพลตฟอร์ม X (อดีต Twitter) เมื่อวันที่ 20 กันยายน 2024 ดร.เทเรนซ์ เทา ผู้ได้รับรางวัลฟิลด์ส เมดัล ซึ่งเป็นรางวัลสูงสุดในวงการคณิตศาสตร์ เปิดเผยประสบการณ์ที่น่าทึ่งจากการทดสอบโมเดลปัญญาประดิษฐ์ (AI) รุ่นใหม่ของ OpenAI ชื่อ ChatGPT 5.5 Pro หรือที่รู้จักในชื่อ o1-pro โมเดลนี้สามารถแก้ปัญหาคณิตศาสตร์ระดับงานวิจัยดุษฎีบัณฑิต (PhD-level) ได้อย่างสมบูรณ์ในเวลาน้อยกว่า 2 ชั่วโมง โดยปราศจากความช่วยเหลือจากมนุษย์ใดๆ
ดร.เทา ซึ่งเป็นศาสตราจารย์ด้านคณิตศาสตร์ที่มหาวิทยาลัยแคลิฟอร์เนีย ลอสแองเจลิส (UCLA) และได้รับการยกย่องว่าเป็นหนึ่งในนักคณิตศาสตร์ที่เก่งกาจที่สุดในโลก ได้เลือกปัญหาจากสาขาทฤษฎีจำนวนวิเคราะห์ (analytic number theory) ซึ่งเป็นปัญหาที่ยากและซับซ้อน โดยทั่วไปแล้ว การแก้ปัญหาประเภทนี้ต้องใช้เวลาและความเชี่ยวชาญจากนักวิจัยหลายเดือนหรือหลายปี ดร.เทาให้คำสั่ง (prompt) แก่โมเดล AI เพียงคำสั่งเดียว โดยไม่ได้ให้คำใบ้หรือข้อมูลเพิ่มเติมใดๆ
ผลลัพธ์ที่ได้คือ โมเดล ChatGPT 5.5 Pro สร้างเอกสารยาวกว่า 20 หน้า ซึ่งประกอบด้วยการพิสูจน์ทางคณิตศาสตร์ (proofs) ไอเดียใหม่ๆ เทคนิค heuristic การคำนวณตัวเลข (numerical experiments) และการอภิปรายถึงขอบเขตของผลลัพธ์ที่ได้ โดยทั้งหมดนี้ใช้เวลารวมเพียง 1.5 ชั่วโมงในการประมวลผล ดร.เทาระบุว่า ผลงานนี้อยู่ในระดับ “research level” หรือระดับงานวิจัยที่สามารถตีพิมพ์ได้จริง และมีแนวคิดที่แปลกใหม่ซึ่งเขาเองก็ไม่เคยคิดถึงมาก่อน
“มันน่าประทับใจมาก มันทำได้ดีเกินคาด” ดร.เทาเขียนในโพสต์ของเขา “ฉันให้ปัญหาที่ยากจากทฤษฎีจำนวนวิเคราะห์กับ o1-pro และมันใช้เวลา 1.5 ชั่วโมงในการสร้าง 20+ หน้าของการพิสูจน์ ไอเดียใหม่ heuristic การทดลองตัวเลข และการอภิปราย โดยไม่มี input จากมนุษย์เพิ่มเติม นี่คือระดับ research จริงๆ และมีแนวคิดบางอย่างที่ฉันไม่เคยคิดถึงด้วยซ้ำ”
โมเดล o1-pro เป็นส่วนหนึ่งของซีรีส์ o1 reasoning models ที่ OpenAI เปิดตัวเมื่อไม่นานมานี้ โดยได้รับการออกแบบมาเพื่อการใช้เหตุผลขั้นสูง (advanced reasoning) โดยเฉพาะ แตกต่างจากโมเดลก่อนหน้าอย่าง GPT-4o ซึ่งมุ่งเน้นการตอบสนองที่รวดเร็ว o1-pro ใช้เทคนิค chain-of-thought (CoT) แบบภายใน ซึ่งช่วยให้ AI คิดทีละขั้นตอนอย่างละเอียดก่อนให้คำตอบสุดท้าย ทำให้เหมาะสมกับงานที่ซับซ้อน เช่น คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
ดร.เทาไม่ได้เปิดเผยรายละเอียดปัญหาเฉพาะเจาะจง เพื่อป้องกันไม่ให้ AI อื่นๆ เรียนรู้จากข้อมูลนั้น แต่เขาเน้นย้ำถึงศักยภาพของโมเดลนี้ในการเร่งกระบวนการวิจัย “นี่เป็นก้าวกระโดดครั้งใหญ่” เขากล่าว “นักวิจัยคณิตศาสตร์สามารถใช้เครื่องมือนี้เพื่อสำรวจไอเดียใหม่ๆ ได้เร็วขึ้นมาก”
ปฏิกิริยาจากชุมชนออนไลน์เป็นไปในเชิงบวก นักวิจัยและผู้เชี่ยวชาญด้าน AI หลายคนแสดงความเห็นด้วยกับดร.เทา บางคนคาดการณ์ว่า เทคโนโลยีนี้จะปฏิวัติวงการวิจัยทางวิชาการ โดยเฉพาะในสาขาที่ต้องใช้การคำนวณและเหตุผลเชิงลึก อย่างไรก็ตาม ดร.เทายังเตือนว่าผลลัพธ์ยังต้องได้รับการตรวจสอบจากมนุษย์ เนื่องจาก AI อาจมีข้อผิดพลาดที่ซ่อนอยู่
OpenAI ยังไม่ได้ยืนยันตัวเลข “ChatGPT 5.5 Pro” อย่างเป็นทางการ แต่จากโพสต์ของดร.เทา ชี้ให้เห็นถึงการพัฒนาที่ก้าวหน้าของโมเดล o1-pro ซึ่งมีราคาใช้งานสูงกว่าโมเดลมาตรฐาน โดยผู้ใช้ ChatGPT Pro สามารถเข้าถึงได้ไม่จำกัด ในขณะที่ผู้ใช้ฟรีมีโควต้าจำกัด
กรณีศึกษานี้ยืนยันถึงความก้าวหน้าของ AI ในการจัดการงานระดับสูงสุด โดยเฉพาะในคณิตศาสตร์ ซึ่งถือเป็นหนึ่งในสาขาที่ยากที่สุดต่อการพัฒนา AI ดร.เทา ซึ่งเคยวิจารณ์โมเดล AI ในอดีตว่ายังอ่อนแอในคณิตศาสตร์ขั้นสูง ตอนนี้ยอมรับว่า o1-pro ได้เปลี่ยนมุมมองของเขา และอาจนำไปสู่การใช้งานจริงในงานวิจัยในอนาคตอันใกล้
การทดสอบนี้เกิดขึ้นท่ามกลางกระแสข่าวการพัฒนาโมเดล AI รุ่นใหม่ๆ จากบริษัทชั้นนำ เช่น OpenAI, Google และ Anthropic ซึ่งแข่งขันกันในการยกระดับความสามารถด้านเหตุผลและการแก้ปัญหา ผลงานของ ChatGPT 5.5 Pro ในครั้งนี้ไม่เพียงแต่เป็นเครื่องพิสูจน์ถึงศักยภาพของ OpenAI แต่ยังจุดประกายให้เกิดการถกเถียงเกี่ยวกับบทบาทของ AI ในวงการวิชาการ โดยเฉพาะการลดระยะเวลาการวิจัยจากหลายเดือนเหลือเพียงชั่วโมง
นอกจากนี้ โพสต์ของดร.เทายังได้รับการรีโพสต์และอ้างอิงจากบุคคลสำคัญในวงการ เช่น Sam Altman CEO ของ OpenAI ผู้ซึ่งชื่นชมผลงานนี้และยืนยันถึงความก้าวหน้าของทีมพัฒนา สิ่งนี้ช่วยเสริมสร้างความเชื่อมั่นให้กับนักลงทุนและนักวิจัยที่กำลังมองหาเครื่องมือ AI เพื่อเร่งนวัตกรรม
โดยสรุป การทดสอบของดร.เทเรนซ์ เทาแสดงให้เห็นว่า AI สมัยใหม่อย่าง ChatGPT 5.5 Pro สามารถเป็นผู้ช่วยวิจัยที่ทรงพลัง โดยเฉพาะในสาขาคณิตศาสตร์ขั้นสูง ซึ่งอาจเปลี่ยนแปลงวิธีการทำงานของนักวิชาการทั่วโลกในอนาคต
(จำนวนคำประมาณ 720 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)