มีเครื่องมือสุขภาพ ai มากกว่าที่เคยมีมา—แต่ทำงานได้ดีแค่ไหน?

เครื่องมือสุขภาพที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ (AI) มีจำนวนเพิ่มขึ้นอย่างมาก แต่ประสิทธิภาพในการทำงานเป็นอย่างไร

ในยุคที่เทคโนโลยีปัญญาประดิษฐ์ก้าวหน้าอย่างรวดเร็ว เครื่องมือสุขภาพที่ใช้ AI ได้กลายเป็นส่วนสำคัญในการดูแลสุขภาพของผู้คนทั่วโลก แอปพลิเคชันสำหรับตรวจจับมะเร็งผิวหนัง หุ่นยนต์แชทสำหรับให้คำปรึกษาสุขภาพจิต และเครื่องมือวิเคราะห์อาการป่วยล่วงหน้า ล้วนแต่มีให้บริการมากมายบนแพลตฟอร์มดิจิทัลต่างๆ ผู้บริโภคสามารถเข้าถึงเครื่องมือเหล่านี้ได้อย่างสะดวก โดยไม่ต้องพึ่งพาแพทย์หรือโรงพยาบาล แต่คำถามสำคัญคือ เครื่องมือเหล่านี้ทำงานได้ดีเพียงใด และน่าเชื่อถือหรือไม่

ตามข้อมูลล่าสุดจากหน่วยงานกำกับดูแลและการศึกษาวิจัย พบว่าเครื่องมือสุขภาพ AI มีจำนวนเพิ่มขึ้นอย่างก้าวกระโดด จากเดิมที่มีเพียงไม่กี่สิบรายการ ปัจจุบันมีหลายพันรายการที่วางตลาด โดยเฉพาะในตลาดผู้บริโภคโดยตรง (direct-to-consumer) ซึ่งไม่ต้องผ่านการรับรองจากหน่วยงานอย่าง US Food and Drug Administration (FDA) ในสหรัฐอเมริกา ตัวอย่างเช่น แอป SkinVision ที่ช่วยตรวจหามะเร็งเมลาโนมา โดยอ้างว่ามีความแม่นยำสูงถึง 95% หรือ Ada Health ซึ่งเป็นเครื่องมือตรวจสอบอาการป่วยที่ให้คำแนะนำเบื้องต้นแก่ผู้ใช้หลายล้านคนทั่วโลก

อย่างไรก็ตาม การศึกษาอิสระหลายชิ้นชี้ให้เห็นถึงความไม่แน่นอนในประสิทธิภาพของเครื่องมือเหล่านี้ รายงานจาก MIT Technology Review ระบุว่า แม้ผู้พัฒนาจะโฆษณาความแม่นยำสูง แต่ผลการทดสอบจริงมักต่ำกว่าที่คาดหวัง เช่น การทดสอบแอปตรวจมะเร็งผิวหนังหลายตัว พบว่าความแม่นยำเฉลี่ยอยู่ที่ 70-80% เท่านั้น และบางตัวตรวจพลาดกรณีรุนแรงถึง 20-30% นอกจากนี้ หุ่นยนต์แชทสำหรับสุขภาพจิตอย่าง Woebot หรือ Wysa ซึ่งให้บริการบำบัดด้วยการสนทนา ก็มีผลลัพธ์ผสมผสาน บางการศึกษาพบว่าช่วยลดอาการซึมเศร้าได้ในระดับหนึ่ง แต่ไม่เทียบเท่ารักษาโดยนักจิตวิทยาจริง

ปัญหาหลักที่ทำให้เกิดความกังวลคือการขาดการตรวจสอบที่เข้มงวด หน่วยงาน FDA ได้รับรองเครื่องมือ AI ทางการแพทย์บางตัว เช่น IDx-DR สำหรับตรวจเบาหวานในดวงตา หรือเครื่องมือวิเคราะห์ภาพถ่ายรังสีเอกซ์ แต่เครื่องมือเหล่านี้จำกัดเฉพาะการใช้งานในคลินิกภายใต้การดูแลของแพทย์ สำหรับเครื่องมือที่ขายตรงสู่ผู้บริโภค ไม่มีกฎระเบียบที่ชัดเจน ทำให้ผู้พัฒนาสามารถนำเสนอผลการทดสอบในชุดข้อมูลที่เลือกสรร (cherry-picked data) ซึ่งอาจไม่สะท้อนความเป็นจริงในผู้ป่วยหลากหลายเชื้อชาติ เพศ หรืออายุ

ดร. เอริค โทโพล ผู้เชี่ยวชาญด้านการแพทย์ดิจิทัลจาก Scripps Research กล่าวว่า “เครื่องมือ AI สุขภาพจำนวนมากยังอยู่ในขั้นทดลอง และขาดการทดสอบในประชากรจริง” เขาชี้ให้เห็นถึงปัญหาความลำเอียง (bias) ในข้อมูลฝึกสอน ซึ่งส่วนใหญ่มาจากกลุ่มประชากรผิวขาวในประเทศพัฒนาแล้ว ส่งผลให้เครื่องมือทำงานได้ดีในบางกลุ่ม แต่พลาดในกลุ่มอื่นๆ เช่น การตรวจมะเร็งผิวหนังในคนผิวสีที่อัตราความแม่นยำต่ำกว่าถึง 30%

นอกจากนี้ การศึกษาจากมหาวิทยาลัยสแตนฟอร์ดและอื่นๆ พบว่าเครื่องมือตรวจอาการป่วยทั่วไป เช่น Symptomate หรือ Buoy Health มีอัตราความถูกต้องในการวินิจฉัยโรคทั่วไปอยู่ที่ 60-70% ซึ่งต่ำกว่าการวินิจฉัยโดยแพทย์ทั่วไปที่ 80-90% ในบางกรณี เครื่องมือเหล่านี้อาจให้คำแนะนำผิดพลาด เช่น แนะนำให้รีบพบแพทย์ในกรณีไม่รุนแรง สร้างความตื่นตระหนกโดยไม่จำเป็น หรือพลาดกรณีฉุกเฉิน

ผู้เชี่ยวชาญแนะนำให้ผู้ใช้ควรระมัดระวัง โดยพิจารณาเครื่องมือที่ผ่านการรับรองจากหน่วยงานที่น่าเชื่อถือ เช่น FDA หรือ CE Mark ในยุโรป และตรวจสอบผลการศึกษาอิสระจากวารสารทางการแพทย์ เช่น The Lancet Digital Health หรือ JAMA Network Open นอกจากนี้ บริษัทเทคโนโลยีสุขภาพชั้นนำอย่าง Google DeepMind และ PathAI กำลังพัฒนาเครื่องมือที่เน้นการตรวจสอบหลายชั้น เพื่อเพิ่มความน่าเชื่อถือ

แม้จะมีความเสี่ยง แต่ศักยภาพของ AI ในสุขภาพไม่อาจปฏิเสธได้ เครื่องมือเหล่านี้ช่วยลดภาระงานของแพทย์ ทำให้การดูแลสุขภาพเข้าถึงได้มากขึ้น โดยเฉพาะในพื้นที่ห่างไกล อนาคตคือการสร้างสมดุลระหว่างนวัตกรรมและความปลอดภัย ผ่านกฎระเบียบที่ชัดเจนและการวิจัยต่อเนื่อง เพื่อให้ AI สุขภาพกลายเป็นเครื่องมือที่เชื่อถือได้จริง

(จำนวนคำประมาณ 720 คำ)

This Article is sponsored by Gnoppix AI (https://www.gnoppix.org)