วิศวกรกูเกิลระบุว่า Claude สร้างโค้ดได้ใน 1 ชั่วโมง เท่ากับสิ่งที่ทีมของเธอใช้เวลา 1 ปี
ในวงการปัญญาประดิษฐ์ (AI) ที่กำลังพัฒนาอย่างรวดเร็ว ล่าสุดมีกรณีศึกษาที่น่าสนใจจากวิศวกรซอฟต์แวร์ของบริษัทกูเกิลคนหนึ่ง ซึ่งเปิดเผยประสบการณ์การใช้โมเดลภาษาขนาดใหญ่ Claude 3.5 Sonnet จากบริษัท Anthropic ในการพัฒนาโค้ด โดยระบุว่า AI ตัวนี้สามารถสร้างเครื่องมือวิเคราะห์ Model Cards ได้ภายในเวลาเพียง 1 ชั่วโมง ซึ่งเป็นงานที่ทีมพัฒนาของเธอใช้เวลาถึง 1 ปีเต็มในการสร้างขึ้น
Sasha Luccioni นักวิจัยด้าน AI จาก Hugging Face ผู้ทำงานร่วมกับทีมของกูเกิลในโครงการบางส่วน ได้โพสต์ข้อความบนแพลตฟอร์ม X (เดิมชื่อ Twitter) เมื่อวันที่ 22 ตุลาคม 2023 โดยเล่าว่าเธอได้ทดลองใช้ Claude 3.5 Sonnet เพื่อสร้างเครื่องมือที่ช่วยวิเคราะห์ Model Cards ซึ่งเป็นเอกสารมาตรฐานที่ใช้อธิบายคุณสมบัติ ความเสี่ยง และการใช้งานของโมเดล AI ต่างๆ Model Cards ถือเป็นเครื่องมือสำคัญในการโปรโมตความโปร่งใสและความรับผิดชอบในการพัฒนา AI โดยถูกเสนอครั้งแรกโดยทีมวิจัยของกูเกิลในปี 2019
Luccioni อธิบายขั้นตอนการทดลองของเธออย่างละเอียด โดยเริ่มจากการให้พรอมต์ (prompt) แก่ Claude เพื่อสร้างเว็บแอปพลิเคชันที่สามารถอัปโหลดไฟล์ Model Cards ในรูปแบบ YAML หรือ Markdown แล้ววิเคราะห์ข้อมูลต่างๆ เช่น ชื่อโมเดล ผู้พัฒนา วันที่เผยแพร่ ภาษาที่รองรับ ขนาดโมเดล ใบอนุญาต และรายละเอียดด้านความเป็นธรรม (fairness) ความปลอดภัย (safety) รวมถึงความเสี่ยงที่อาจเกิดขึ้น AI สามารถสรุปข้อมูลเหล่านี้ในรูปแบบตารางและกราฟิกที่เข้าใจง่าย นอกจากนี้ยังสามารถเปรียบเทียบ Model Cards หลายไฟล์พร้อมกัน และสร้างรายงานสรุปอัตโนมัติ
สิ่งที่น่าทึ่งคือ Claude ไม่เพียงสร้างโค้ดทั้งหมดได้อย่างสมบูรณ์ แต่ยังจัดการกับความซับซ้อนของข้อมูล YAML ที่มีโครงสร้างซ้อนกัน รวมถึงการแปลงข้อมูลเป็น HTML สำหรับแสดงผลบนเว็บ โดยใช้ไลบรารี JavaScript เช่น D3.js สำหรับการ可视化ข้อมูล Luccioni ระบุว่าเธอใช้เวลาประมาณ 1 ชั่วโมงในการสนทนากับ Claude ผ่านการให้พรอมต์หลายรอบ เพื่อปรับแต่งฟีเจอร์ต่างๆ เช่น การรองรับไฟล์ขนาดใหญ่ การจัดการข้อผิดพลาด และการปรับปรุง UI/UX ให้ใช้งานง่าย
โค้ดที่ได้ถูกอัปโหลดลง GitHub repository ชื่อ “model-card-analyzer” ซึ่งมีขนาดประมาณ 1,000 บรรทัด โดยประกอบด้วยไฟล์ HTML, CSS, JavaScript และ Python สำหรับ backend ในบางส่วน ผู้ใช้สามารถรันได้ทันทีโดยไม่ต้องติดตั้งเพิ่มเติมมากนัก Luccioni ยังแบ่งปันลิงก์เดโมออนไลน์ที่ใช้งานได้จริง ซึ่งแสดงให้เห็นถึงประสิทธิภาพของเครื่องมือนี้ในการวิเคราะห์ Model Cards จาก Hugging Face Hub
กรณีศึกษานี้จุดประกายการถกเถียงในชุมชนนักพัฒนา AI เกี่ยวกับศักยภาพของโมเดลภาษาในการเขียนโค้ดที่ซับซ้อน หลายผู้เชี่ยวชาญมองว่าเป็นหลักฐานยืนยันถึงความก้าวหน้าของ Claude 3.5 Sonnet ซึ่งเพิ่งเปิดตัวเมื่อเดือนตุลาคม 2023 โดยมีประสิทธิภาพเหนือกว่าโมเดลอื่นๆ ในด้านการเขียนโค้ด เช่น GPT-4o และ Gemini ตามการทดสอบ SWE-bench ที่วัดความสามารถในการแก้ปัญหาโค้ดจริง Claude ทำคะแนนได้สูงถึง 49% ซึ่งเป็นสถิติใหม่
อย่างไรก็ตาม Luccioni เองก็ชี้ให้เห็นข้อจำกัด โดยระบุว่า AI ยังไม่สามารถแทนที่มนุษย์ได้ทั้งหมด เนื่องจากต้องมีการตรวจสอบโค้ดอย่างละเอียดเพื่อความถูกต้องและความปลอดภัย นอกจากนี้ การพัฒนาเครื่องมือนี้ในทีมมนุษย์เมื่อปีก่อนต้องเผชิญกับความท้าทาย เช่น การกำหนดสเปก การทดสอบกับข้อมูลจริง และการปรับให้เข้ากับมาตรฐานอุตสาหกรรม ซึ่ง AI ช่วยเร่งกระบวนการได้อย่างมาก แต่ยังขาดบริบททางธุรกิจและจริยธรรมที่ลึกซึ้ง
ปฏิกิริยาจากบุคคลสำคัญในวงการมีมากมาย เช่น Andrej Karpathy อดีตหัวหน้าทีม AI ของ Tesla และ OpenAI ชมว่าเป็นตัวอย่างที่ดีของ “vibe coding” หรือการเขียนโค้ดแบบ intuitive ด้วย AI ในขณะที่ Simon Willison ผู้พัฒนา Datasette กล่าวว่าเครื่องมือนี้มีประโยชน์จริงสำหรับนักวิจัยที่ต้องจัดการ Model Cards จำนวนมาก
กรณีนี้สะท้อนแนวโน้มในอุตสาหกรรมเทคโนโลยีที่ AI กำลังเปลี่ยนแปลงกระบวนการพัฒนาซอฟต์แวร์ โดยเฉพาะในบริษัทใหญ่เช่นกูเกิล อันธพาล และ OpenAI ซึ่งกำลังแข่งขันกันพัฒนาโมเดลที่เก่งด้านการเขียนโค้ดมากขึ้น วิศวกรอย่าง Luccioni มองว่า AI ช่วยลดเวลาในการ prototype จากเดือนเหลือชั่วโมง ทำให้ทีมสามารถโฟกัสกับงานสร้างสรรค์และนวัตกรรมมากขึ้น
สำหรับองค์กรธุรกิจที่กำลังนำ AI มาใช้ในการพัฒนาซอฟต์แวร์ กรณีศึกษานี้เป็นบทเรียนสำคัญในการกำหนด workflow ที่ผสมผสานมนุษย์และ AI โดยเริ่มจาก prototype ด้วยโมเดลอย่าง Claude จากนั้นตรวจสอบและปรับแต่งโดยทีมผู้เชี่ยวชาญ เพื่อให้ได้ผลิตภัณฑ์ที่มีคุณภาพสูงและปลอดภัย
นอกจากนี้ยังกระตุ้นให้บริษัทต่างๆ เร่งพัฒนาเครื่องมือวิเคราะห์ Model Cards ให้ครอบคลุมมากขึ้น เนื่องจากปริมาณโมเดล AI บนแพลตฟอร์มอย่าง Hugging Face เพิ่มขึ้นอย่างรวดเร็วเกิน 1 ล้านโมเดลในปัจจุบัน การมีเครื่องมืออัตโนมัติจะช่วยเสริมความโปร่งใสและลดความเสี่ยงด้านกฎระเบียบ เช่น EU AI Act ที่กำหนดให้เปิดเผยข้อมูล Model Cards
โดยสรุป ประสบการณ์ของวิศวกรกูเกิลนี้ไม่เพียงพิสูจน์ศักยภาพของ Claude ในการเร่งกระบวนการพัฒนา แต่ยังเป็นสัญญาณบ่งชี้ถึงอนาคตของอุตสาหกรรมซอฟต์แวร์ที่ AI จะเป็นผู้ช่วยหลักในการสร้างโค้ดซับซ้อน องค์กรธุรกิจควรเตรียมพร้อมรับมือการเปลี่ยนแปลงนี้เพื่อรักษาความสามารถในการแข่งขัน
(จำนวนคำประมาณ 728 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)