David Silver ผู้เชี่ยวชาญจาก DeepMind ระดมทุนรอบ Seed 1 พันล้านดอลลาร์ เพื่อสร้างสติปัญญายอดมนุษย์โดยไม่ใช้ LLM

เดวิด ซิลเวอร์ อดีตนักวิจัยระดับสูงจากดีพไมนด์ ระดมทุนเมล็ดพันธุ์ 1 พันล้านดอลลาร์สหรัฐ เพื่อพัฒนาสุปัญญาอัจฉริยะเหนือมนุษย์โดยไม่ใช้โมเดลภาษาขนาดใหญ่

เดวิด ซิลเวอร์ นักวิทยาศาสตร์คอมพิวเตอร์ชาวอังกฤษ ผู้อยู่เบื้องหลังความสำเร็จอันยิ่งใหญ่ของโปรเจกต์อัลฟาโกและอัลฟาซีโรจากดีพไมนด์ ได้ประกาศก่อตั้งบริษัทสตาร์ทอัพเอไอใหม่ โดยระดมทุนในระยะเมล็ดพันธุ์ (Seed Round) ได้ถึง 1 พันล้านดอลลาร์สหรัฐ ซึ่งถือเป็นจำนวนเงินที่สูงเป็นประวัติการณ์สำหรับระยะการลงทุนเริ่มต้นนี้ การระดมทุนดังกล่าวนำโดยบริษัทแอนเดรสเซน ฮอโรวิทซ์ (a16z) ซึ่งลงทุนจำนวน 600 ล้านดอลลาร์สหรัฐ ร่วมด้วยนักลงทุนรายอื่นๆ เช่น ซีควอยอา แคปิตอล และกองทุนชั้นนำอื่นๆ ในอุตสาหกรรมเทคโนโลยี

บริษัทใหม่ของซิลเวอร์มุ่งเน้นการพัฒนาสุปัญญาอัจฉริยะเหนือมนุษย์ (Superintelligence) โดยใช้แนวทางที่แตกต่างจากกระแสหลักในปัจจุบันอย่างสิ้นเชิง นั่นคือ ไม่พึ่งพาโมเดลภาษาขนาดใหญ่ (Large Language Models หรือ LLMs) ซึ่งเป็นเทคโนโลยีหลักที่บริษัทอย่างโอเพ่นเอไอและแอนทโทรปิกใช้ในการพัฒนาเอไอเจนเนอเรทีฟ ซิลเวอร์เชื่อมั่นว่า LLMs แม้จะประสบความสำเร็จในการประมวลผลภาษาธรรมชาติและสร้างเนื้อหาได้อย่างน่าทึ่ง แต่ยังไม่เพียงพอต่อการบรรลุเป้าหมายสุปัญญาอัจฉริยะที่แท้จริง เขาเน้นย้ำถึงการใช้เทคนิคการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning หรือ RL) และการวางแผนเชิงโมเดล (Model-based Planning) ซึ่งเป็นรากฐานจากผลงานของเขาที่ดีพไมนด์

ซิลเวอร์เป็นผู้นำทีมพัฒนาอัลฟาโก ซึ่งเป็นระบบเอไอที่เอาชนะลี เซโดล แชมป์โลกโกะ 18 สมัยในปี 2559 ถือเป็นจุดเปลี่ยนสำคัญที่พิสูจน์ว่าเอไอสามารถเอาชนะมนุษย์ในเกมยุทธศาสตร์ที่ซับซ้อนได้ ต่อมาอัลฟาซีโร ซึ่งพัฒนาต่อยอดจากอัลฟาโก สามารถเรียนรู้และเอาชนะโปรแกรมแชมป์โลกในหมากรุก หมากฮเวทสโตน และโกะได้ โดยไม่ต้องใช้ข้อมูลฝึกฝนจากมนุษย์เลย อาศัยเพียงการเล่นแบบตัวต่อตัว (Self-play) ผลงานเหล่านี้ทำให้ซิลเวอร์กลายเป็นบุคคลสำคัญในวงการเอไอ โดยเฉพาะด้าน RL ซึ่งเขาได้รับการยกย่องว่าเป็นหนึ่งในผู้บุกเบิก

ในแถลงการณ์ ซิลเวอร์ระบุว่า “เราต้องการสร้างเอไอที่สามารถคิด วางแผน และแก้ปัญหาในระดับที่เหนือกว่ามนุษย์ โดยไม่ต้องพึ่งพาการขยายขนาดข้อมูลและพารามิเตอร์แบบ LLMs ซึ่งมีข้อจำกัดด้านความปลอดภัยและประสิทธิภาพในระยะยาว” แนวทางของบริษัทใหม่นี้จะมุ่งพัฒนาระบบเอไอที่ใช้การจำลองสถานการณ์ภายใน (Internal Simulation) และการเรียนรู้จากประสบการณ์จริง เพื่อให้เอไอสามารถตัดสินใจได้อย่างมีเหตุผลและปลอดภัยมากขึ้น โดยหลีกเลี่ยงปัญหาการเพ้อเจ้อ (Hallucination) และพฤติกรรมที่คาดเดาไม่ได้ที่พบใน LLMs

ทีมงานของบริษัทประกอบด้วยผู้เชี่ยวชาญชั้นนำกว่า 10 คน จากดีพไมนด์ โอเพ่นเอไอ และสถาบันวิจัยเอไออื่นๆ รวมถึงตัวซิลเวอร์เองที่ลาออกจากดีพไมนด์หลังจากทำงานนานกว่า 10 ปี แม้จะยังคงเป็นที่ปรึกษาให้กับบริษัทแม่อย่างแอลฟาเบทในบางโครงการ การระดมทุนมหาศาลนี้สะท้อนถึงความเชื่อมั่นของนักลงทุนต่อวิสัยทัศน์ของซิลเวอร์ โดยเฉพาะในช่วงที่ตลาดเอไอกำลังเผชิญความท้าทายจากต้นทุนการฝึกโมเดล LLMs ที่พุ่งสูงขึ้นและข้อกังวลด้านพลังงานและสิ่งแวดล้อม

a16z ซึ่งนำการลงทุนครั้งนี้ ระบุผ่านบล็อกอย่างเป็นทางการว่า “เดวิด ซิลเวอร์คือผู้ที่พิสูจน์แล้วว่า RL สามารถนำไปสู่ความก้าวหน้าที่แท้จริงในเอไอ การลงทุนนี้คือการเดิมพันกับอนาคตของสุปัญญาที่มั่นคงและยั่งยืน” นักลงทุนรายอื่นๆ มองว่านี่คือโอกาสในการหลุดพ้นจากวงจรการแข่งขันด้านขนาดโมเดลที่กำลังอิ่มตัว โดยหันไปสู่แนวทางที่เน้นคุณภาพและประสิทธิภาพแทน

อย่างไรก็ตาม การพัฒนาสุปัญญาอัจฉริยะโดยไม่ใช้ LLMs ยังเผชิญความท้าทาย เช่น การขยายขนาด RL ให้ครอบคลุมงานจริงในโลกที่ซับซ้อน และการรับประกันความปลอดภัย (Alignment) เพื่อป้องกันความเสี่ยงจากการกระทำที่ไม่คาดคิด ซิลเวอร์ยอมรับว่าการเดินทางนี้จะยาวนาน แต่ผลงานในอดีตของเขาทำให้เกิดความหวังว่าบริษัทนี้อาจเป็นผู้บุกเบิกเส้นทางใหม่สู่เอไอระดับสูงสุด

การประกาศครั้งนี้เกิดขึ้นท่ามกลางกระแสการแข่งขันเอไอที่ร้อนระอุ โดยบริษัทสตาร์ทอัพเอไอหลายแห่งระดมทุนได้ในระดับพันล้านดอลลาร์ เช่น xAI ของอีลอน มัสก์และ Anthropic แต่กรณีของซิลเวอร์โดดเด่นด้วยจำนวนเงินในระยะ Seed ที่ไม่เคยมีมาก่อน และการหลีกเลี่ยง LLMs ซึ่งอาจเปลี่ยนแปลงทิศทางของอุตสาหกรรมในอนาคต

บริษัทของซิลเวอร์ยังไม่เปิดเผยชื่ออย่างเป็นทางการ แต่คาดว่าจะเริ่มดำเนินงานเต็มรูปแบบในปีหน้า โดยมีเป้าหมายหลักในการพัฒนาเอไอสำหรับงานที่ต้องการการวางแผนเชิงกลยุทธ์ เช่น การแพทย์ การเงิน และโลจิสติกส์ ซึ่งจะเป็นการประยุกต์ RL ในเชิงพาณิชย์ครั้งใหญ่

การเคลื่อนไหวของซิลเวอร์ไม่เพียงแต่เป็นข่าวใหญ่ในวงการเทคโนโลยี แต่ยังสะท้อนถึงการเปลี่ยนผ่านในยุทธศาสตร์เอไอ จากการไล่ตามขนาดสู่การมุ่งเน้นวิธีการที่ชาญฉลาดและยั่งยืนมากขึ้น นักวิเคราะห์คาดการณ์ว่าการลงทุนครั้งนี้อาจจุดประกายให้เกิดคลื่นลูกใหม่ของนวัตกรรม RL และการวางแผนเอไอ

(จำนวนคำประมาณ 728 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)