ดัชนีความคาดหวังสูงสุดของ AI: Grok สร้างภาพอนาจาร Claude เขียนโค้ดแซงงานมนุษย์
ในโลกของปัญญาประดิษฐ์ (AI) ที่พัฒนาอย่างรวดเร็ว ความตื่นเต้นและความคาดหวังจากสาธารณชนมักพุ่งสูงเกินจริง โดยเฉพาะเมื่อบริษัทเทคโนโลยีชั้นนำประกาศความก้าวหน้าล่าสุด ดัชนีความคาดหวังสูงสุดของ AI (AI Hype Index) จาก MIT Technology Review จึงเกิดขึ้นเพื่อวัดระดับความตื่นเต้นเหล่านี้ โดยเปรียบเทียบระหว่างคำมั่นสัญญาที่ประกาศกับความเป็นจริงที่เกิดขึ้น ดัชนีนี้แบ่งระดับความคาดหวังออกเป็น 5 ระดับ ตั้งแต่ “น่าเบื่อ” (Boring) ไปจนถึง “บ้าคลั่ง” (Unhinged) โดยพิจารณาจากปริมาณโพสต์บนโซเชียลมีเดีย ความครอบคลุมของสื่อ และผลกระทบที่แท้จริง
ล่าสุด ดัชนีชี้วัดความเคลื่อนไหวเด่น ๆ ในสัปดาห์ที่ผ่านมา โดยเฉพาะการอัปเกรดของ Grok-2 จาก xAI ที่ก่อให้เกิดกระแสวิพากษ์วิจารณ์อย่างหนัก หลังจากที่โมเดลนี้เปิดตัวฟีเจอร์สร้างภาพด้วย Flux.1 ซึ่งเป็นโมเดลสร้างภาพแบบเปิด (open-weight) ที่ไม่มีตัวกรองเนื้อหาอนาจาร (NSFW filter) ทำให้ผู้ใช้สามารถสร้างภาพลามกอนาจารได้อย่างอิสระ Elon Musk ผู้ก่อตั้ง xAI ประกาศผ่าน X (เดิมคือ Twitter) ว่า “ไม่มีโหมดเซ็นเซอร์อีกต่อไป” ซึ่งจุดชนวนให้เกิดกระแสตอบรับทั้งเชิงบวกและลบ โดยผู้สนับสนุนมองว่าเป็นการส่งเสริมเสรีภาพในการแสดงออก ในขณะที่นักวิจารณ์กังวลเรื่องการแพร่กระจายเนื้อหาที่เป็นอันตราย เช่น ภาพลึกเทียร์ (deepfake) หรือภาพอนาจารที่เกี่ยวข้องกับบุคคลจริง
การทดสอบจริงพบว่า Grok-2 สร้างภาพอนาจารได้อย่างมีประสิทธิภาพสูง โดยสามารถผลิตภาพนู้ดของบุคคลดัง เช่น Taylor Swift หรือภาพแฟนตาซีที่ละเอียดอ่อนได้ภายในไม่กี่วินาที นักวิเคราะห์จาก MIT Technology Review ให้คะแนนความคาดหวังที่ระดับ “บ้าคลั่ง” (Unhinged) เนื่องจากกระแสบนโซเชียลมีเดียพุ่งสูง โดยเฉพาะในชุมชนออนไลน์ที่ชื่นชอบเนื้อหา NSFW อย่างไรก็ตาม ความก้าวหน้านี้ไม่ได้ปฏิวัติวงการ AI อย่างแท้จริง เนื่องจากโมเดล Flux.1 เป็นของ Black Forest Labs ซึ่ง xAI นำมาใช้เท่านั้น และปัญหาการเซ็นเซอร์ยังคงเป็นประเด็นถกเถียงในอุตสาหกรรม
ในขณะเดียวกัน Anthropic ได้เปิดตัว Claude 3.5 Sonnet ซึ่งโดดเด่นด้วยความสามารถในการเขียนโค้ดที่เหนือชั้น โมเดลนี้ทำคะแนนสูงสุดในบ enchmark หลายรายการ เช่น SWE-bench ที่วัดความสามารถในการแก้ปัญหาโค้ดจริงจาก GitHub โดยได้คะแนน 49% ซึ่งสูงกว่าโมเดลอื่น ๆ อย่าง GPT-4o (33.2%) และ o1 จาก OpenAI (48.9%) Claude สามารถเขียนแอปพลิเคชันเต็มรูปแบบ เช่น เกม Blackjack บนเว็บที่ใช้งานได้จริงภายในไม่กี่นาที โดยใช้ HTML, CSS และ JavaScript ผู้พัฒนาซอฟต์แวร์หลายรายรายงานว่ามันช่วยลดเวลาในการเขียนโค้ดได้มากถึง 50-70% ในบางกรณี
ความสามารถนี้ก่อให้เกิดความกังวลเรื่องการแทนที่งานมนุษย์ โดยเฉพาะในสายงานโปรแกรมเมอร์ระดับจูเนียร์และมิดเดิล Anthropic เองยอมรับว่า Claude 3.5 Sonnet “เก่งที่สุดในโลกด้านการเขียนโค้ด” และกำลังมุ่งสู่การเป็น “วิศวกรซอฟต์แวร์ AI” ดัชนีความคาดหวังให้คะแนนที่ระดับ “ตื่นเต้นมาก” (Very Exciting) เนื่องจากผลลัพธ์ที่จับต้องได้และการใช้งานจริงในอุตสาหกรรม แต่ยังไม่ถึงขั้น “บ้าคลั่ง” เพราะยังมีข้อจำกัด เช่น การจัดการกับโค้ดขนาดใหญ่หรือการดีบักที่ซับซ้อน
นอกจากนี้ ยังมีข่าวอื่น ๆ ที่น่าสนใจ เช่น OpenAI ที่อัปเดตโมเดล o1 ให้รองรับการอัปโหลดไฟล์และการใช้เครื่องมือภายนอกมากขึ้น ทำให้สามารถวิเคราะห์เอกสารและรันโค้ดได้ดีกว่าเดิม นอกจากนี้ Perplexity AI เปิดตัว Comet ซึ่งเป็นเบราว์เซอร์ที่ขับเคลื่อนด้วย AI เพื่อช่วยค้นหาและสรุปข้อมูลบนเว็บ ส่วน Google DeepMind ประกาศ AlphaGenome ที่ช่วยคาดการณ์การทำงานของยีนได้แม่นยำขึ้น อย่างไรก็ตาม ข่าวเหล่านี้ได้รับความสนใจน้อยกว่า โดยดัชนีให้คะแนนที่ระดับ “น่าติดตาม” (Worth Watching) ถึง “น่าเบื่อ” (Boring)
กระแส hype รอบ AI agents ก็ยังคงร้อนแรง โดยบริษัทอย่าง Adept และ MultiOn พยายามสร้างเอเจนต์ที่ทำงานอัตโนมัติได้ เช่น จองตั๋วเครื่องบินหรือช้อปปิ้งออนไลน์ แต่ผลลัพธ์จริงยังห่างไกลจากคำมั่นสัญญา ในด้านการศึกษา Khan Academy เปิดตัว Khanmigo ซึ่งเป็นติวเตอร์ AI ที่ช่วยนักเรียนแก้โจทย์คณิตศาสตร์ แต่ผู้เชี่ยวชาญชี้ว่ายังไม่สามารถแทนที่ครูมนุษย์ได้อย่างสมบูรณ์
โดยรวมแล้ว สัปดาห์นี้สะท้อนถึงความเหลื่อมล้ำระหว่าง hype กับความจริง Grok-2 ดึงดูดความสนใจด้วยความกล้าบ้าบิ่น แต่ Claude 3.5 Sonnet นำเสนอคุณค่าทางธุรกิจที่แท้จริงมากกว่า ผู้เชี่ยวชาญแนะนำให้นักลงทุนและผู้ประกอบการมองข้ามกระแสชั่วคราว และโฟกัสที่การนำ AI ไปใช้ในกระบวนการทำงานจริง เพื่อสร้างประโยชน์ยั่งยืน
ดัชนีความคาดหวังยังคงเตือนว่า AI กำลังเข้าสู่ยุคที่การแข่งขันเข้มข้นขึ้น โดย xAI, Anthropic และ OpenAI เป็นผู้นำที่ผลัดกันรุก แต่ความสำเร็จที่ยั่งยืนจะขึ้นอยู่กับการแก้ปัญหาจริง ไม่ใช่แค่การสร้างกระแสบนโซเชียลมีเดีย
(จำนวนคำประมาณ 720 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)