กูเกิลเปิดตัว FunctionGemma เพื่อนำคำสั่งปัญญาประดิษฐ์สู่สมาร์ทโฟน
กูเกิลได้ประกาศเปิดตัว FunctionGemma ซึ่งเป็นชุดโมเดลปัญญาประดิษฐ์ที่ได้รับการฝึกฝนอย่างเฉพาะเจาะจงสำหรับการเรียกใช้ฟังก์ชัน (function calling) โดยสามารถทำงานบนสมาร์ทโฟนได้อย่างมีประสิทธิภาพ FunctionGemma พัฒนาขึ้นบนพื้นฐานของ Gemma 2 ซึ่งเป็นโมเดลขนาดกะทัดรัดและเปิดกว้างของกูเกิล โดยมีขนาดพารามิเตอร์ 2 พันล้าน (2B) และ 4 พันล้าน (4B) พร้อมเวอร์ชันที่ถูก量化 (quantized) เพื่อเพิ่มประสิทธิภาพในการใช้งานบนอุปกรณ์ปลายทาง
โมเดลเหล่านี้ถูกออกแบบมาเพื่อรองรับการทำงานแบบตัวแทนปัญญาประดิษฐ์ (agentic AI) บนอุปกรณ์เคลื่อนที่ โดยช่วยให้ผู้ใช้สามารถสั่งงานด้วยภาษาธรรมชาติ เช่น ส่งข้อความ ตั้งนาฬิกาปลุก หรือจัดการงานอื่นๆ บนสมาร์ทโฟน โดยไม่จำเป็นต้องพึ่งพาการเชื่อมต่อคลาวด์ ซึ่งช่วยลดความล่าช้า เพิ่มความเป็นส่วนตัว และประหยัดพลังงาน การเปิดตัว FunctionGemma ถือเป็นก้าวสำคัญในการนำเทคโนโลยีปัญญาประดิษฐ์มาสู่ขอบเขตอุปกรณ์ (edge devices) ทำให้สมาร์ทโฟนสามารถตอบสนองคำสั่งที่ซับซ้อนได้ทันที
กระบวนการฝึกฝนของ FunctionGemma อาศัย pipeline การสร้างข้อมูลสังเคราะห์ (synthetic data generation) ซึ่งกูเกิลพัฒนาขึ้นเอง โดยใช้โมเดลขนาดใหญ่ เช่น Gemini 2.0 เพื่อสร้างชุดข้อมูลคุณภาพสูงสำหรับการฝึก function calling ชุดข้อมูลนี้ประกอบด้วยตัวอย่างคำสั่งภาษาธรรมชาติที่เชื่อมโยงกับการเรียกใช้ฟังก์ชันเฉพาะ เช่น การดึงข้อมูลสภาพอากาศ การจองตั๋ว หรือการควบคุมอุปกรณ์ IoT ทำให้โมเดลสามารถเข้าใจบริบทและเรียกใช้เครื่องมือที่เหมาะสมได้อย่างแม่นยำ
ในด้านประสิทธิภาพ FunctionGemma แสดงผลงานโดดเด่นใน基准การทดสอบหลายรายการ เช่น Berkeley Function-Calling Leaderboard (BFCL) ซึ่งโมเดล 2B ได้คะแนนสูงสุดในหมวดโมเดลขนาดเล็ก และโมเดล 4B อยู่ในอันดับต้นๆ ของโมเดลขนาดกลาง นอกจากนี้ ยังมีผลงานยอดเยี่ยมใน LM-Eval Function Calling และ nLM Arena โดยเฉพาะเวอร์ชัน quantized ที่รักษาความสามารถได้ดีแม้จะลดขนาดโมเดลลง การทดสอบเหล่านี้ยืนยันว่า FunctionGemma สามารถแข่งขันกับโมเดลชั้นนำอื่นๆ ได้ แม้จะมีขนาดเล็กกว่ามาก
FunctionGemma เป็นส่วนหนึ่งของ Google AI Edge ซึ่งเป็นโครงการที่มุ่งพัฒนาโมเดลปัญญาประดิษฐ์สำหรับใช้งานบนอุปกรณ์ โดยเน้นความเร็ว ความแม่นยำ และการใช้ทรัพยากรต่ำ โมเดลเหล่านี้มีน้ำหนักแบบเปิด (open weights) ภายใต้ใบอนุญาต permissive license ทำให้ผู้พัฒนาสามารถดาวน์โหลด นำไปปรับแต่ง และนำไปใช้งานในแอปพลิเคชันได้อย่างอิสระ สามารถเข้าถึงได้ผ่าน Hugging Face และแพลตฟอร์มอื่นๆ ของกูเกิล เช่น MediaPipe และ TensorFlow Lite
การนำ FunctionGemma ไปใช้จะช่วยยกระดับประสบการณ์ผู้ใช้บนสมาร์ทโฟน โดยเฉพาะในยุคที่แอปพลิเคชันต้องการการโต้ตอบแบบเรียลไทม์ เช่น ผู้ช่วยส่วนตัวอัจฉริยะที่สามารถจัดการงานประจำวันได้โดยอัตโนมัติ นอกจากนี้ ยังเปิดโอกาสให้ผู้ประกอบการพัฒนาโซลูชันใหม่ๆ เช่น แอปจัดการสุขภาพที่สั่งงานเซ็นเซอร์โดยตรง หรือแอปธุรกิจที่เชื่อมต่อกับระบบ CRM บนอุปกรณ์เคลื่อนที่ โดยไม่เปิดเผยข้อมูลส่วนบุคคลสู่เซิร์ฟเวอร์ภายนอก
กูเกิลยังได้เผยแพร่เอกสารประกอบและตัวอย่างโค้ดเพื่อช่วยเหลือผู้พัฒนาในการรวม FunctionGemma เข้ากับแพลตฟอร์ม Android และ iOS ทำให้กระบวนการพัฒนารวดเร็วและง่ายดายยิ่งขึ้น ด้วยขนาดโมเดลที่เหมาะสม FunctionGemma สามารถรันบนสมาร์ทโฟนรุ่นกลางๆ ได้โดยไม่กระทบต่อประสิทธิภาพแบตเตอรี่หรือหน่วยความจำ
โดยสรุป FunctionGemma ไม่เพียงแต่เป็นเครื่องมือที่ทรงพลังสำหรับการเรียกใช้ฟังก์ชันบนอุปกรณ์ แต่ยังเป็นตัวเร่งให้เกิดนวัตกรรมในอุตสาหกรรมสมาร์ทโฟน ผู้พัฒนาและธุรกิจสามารถใช้ประโยชน์จากเทคโนโลยีนี้เพื่อสร้างผลิตภัณฑ์ที่ชาญฉลาดและตอบโจทย์ผู้ใช้ได้ดียิ่งขึ้น
(จำนวนคำประมาณ 720 คำ)
This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)