看板 Gossiping 關於我們 聯絡資訊
微軟公開AI多輪診斷系統MAI-DxO研究,高難度臨床病例測試優於專科醫師 微軟發表MAI-DxO人工智慧診斷研究,在高難度臨床病例測試中正確率達85%,明顯優於 專科醫師,展現生成式人工智慧提升臨床診斷準確率與醫療資源運用效率的潛力 ithome 文/李建興 | 2025-07-01發表 微軟人工智慧團隊發表研究,展現其在人工智慧診斷調度系統在臨床醫學領域的進展。根 據微軟公開的資料,該團隊開發的MAI-DxO系統,在針對美國《新英格蘭醫學期刊》 (NEJM)收錄的304個高難度病例進行逐步診斷的測試中,最高達到85%的正確診斷率,明 顯優於由21位具多年臨床經驗的美國與英國專科醫師平均僅20%的表現。 微軟開發MAI-DxO系統,採用生成式人工智慧多模型協作機制,模擬虛擬醫師小組針對複 雜病例逐步詢問病史,並選擇檢查項目以及依據回饋資訊調整推論方向。這一診斷流程更 貼近臨床現場,突破過往單一選擇題式人工智慧測試對臨床推理能力的侷限,進一步提升 醫療人工智慧在實際場域的評估深度。 為驗證人工智慧臨床決策能力,研究團隊將NEJM發表的病例轉換為數位互動情境,要求人 工智慧與專業醫師在同樣資訊條件下進行連續診斷測試。人工智慧系統除了能更快收斂到 正確診斷,也可根據虛擬成本限制合理安排檢查項目,避免過度檢查帶來的不必要支出或 病患負擔。測試結果顯示,MAI-DxO不僅於診斷準確率領先現有人力團隊,在醫療資源分 配與成本意識方面也展現可稽核與調整彈性。 該系統整合多家主流人工智慧基礎模型,包括GPT、Llama、Claude、Gemini等,採用多模 型協作機制來彌補單一模型推理盲點,提升系統的穩定性與適應力。微軟團隊強調, MAI-DxO可針對不同醫療情境調整診斷準則與成本權重,進一步強化在高度專業、高風險 環境中的可靠性與可追蹤性。 雖然此次成果集中於複雜、少見的臨床案例,並以專業醫師不借助外部資源、同僚協助或 現有人工智慧工具下的表現為基準,但MAI-DxO於真實世界應用尚需進一步擴大測試範圍 ,包括對常見病症的實際臨床表現與跨區域醫療系統的適應性。同時,醫療人工智慧大規 模落地前仍有賴於治理、法遵及持續實證,以確保診斷安全性與效益。 https://www.ithome.com.tw/news/169830 ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.227.198.72 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1751506590.A.88C.html ※ 編輯: Qunnine (36.227.198.72 臺灣), 07/03/2025 09:37:40
vindiesl2000: 真不愧是頭頭是道地胡說八道220.136.151.139 07/03 09:37
hgs1906: 依記錄與統計 開個2給他 讓他得肺癌 125.229.224.99 07/03 09:39
alittleghost: 不可以這樣說醫生 42.79.166.221 07/03 09:57
marunouchi: 你不會信電腦,但醫師照著電腦唸出來223.139.186.150 07/03 10:04
marunouchi: 你會相信223.139.186.150 07/03 10:04
DIVIS: 20%還不如用猜的 1.173.119.78 07/03 10:04
Erechtheus: 多年專科經驗命中率才20%?? 27.52.0.20 07/03 10:13
Erechtheus: 不要都拿黑傑克的Case唬人哦 27.52.0.20 07/03 10:14