看板 Gossiping 關於我們 聯絡資訊
https://udn.com/news/story/6812/8552573 失智症檢測不及格!較老的AI模型 表現出認知受損跡象 經濟日報/ 編譯季晶晶/綜合外電 根據英國醫學期刊(BMJ)2024年12月20日刊出的研究論文,大型語言模型(LLM)和聊天 機器人等人工智慧(AI)技術,也像人一樣,會因為年齡,出現認知能力退化的跡象。這 表示,即使醫療診斷愈來愈常仰賴AI,在肉眼明顯察覺之前,快速有效地從病歷、X光片 和其他資料裡發現異常,但AI還不能很快地取代真人醫生。 科學家使用「蒙特婁認知評估」(MoCA)來測試市面上公開的、由LLM驅動的聊天機器人 ,包括OpenAI的ChatGPT、Anthropic的Sonnet,以及Alphabet的Gemini。MoCA是專用來檢 測老年人早期癡呆或認知受損的工具,滿分30分,人類受測者26分以上代表合格,認知無 障礙。 對大多數LLM來說,它們在命名、專注力、語言能力和抽象概念等測試的某些方面看起來 很輕鬆,但在視覺空間建構和執行功能的表現都不好,有幾個在延遲記憶比其他LLM表現 更差。 至關重要的是,雖然ChatGPT最新版本(第4版)得分最高(30分裡獲26分),但較舊的 Gemini 1.0僅得16分,導致了「較舊LLM出現認知能力衰退跡象」的結論。 這些發現挑戰了AI將很快取代人類醫生的假設。具體而言,研究作者反對在需要視覺抽象 思維和執行功能的任務中使用AI,「領先的聊天機器人身上認知能力受損明顯,可能影響 它們進行醫療診斷的可靠性,並削弱患者信心。」 根據研究作者,他們的發現僅僅是觀察性的,AI與人類心智運作方式的關鍵差異意味實驗 無法構成直接的比較。但他們警告說,這可能是給AI臨床醫學應用踩煞車的「重大弱點」 。 -- AI好棒棒 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.246.107.70 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1739759909.A.C28.html
driver0811: 專家系統死灰復燃 42.79.181.164 02/17 10:42
vowpool: 英國研究 125.227.40.62 02/17 10:45
preisner: 五樓得分是3分 60.248.161.28 02/17 10:48
BKcrow: 原來AI也懂返老還童? 42.77.31.250 02/17 10:48
tsubasawolfy: 這篇記者在寫啥.. 42.77.170.222 02/17 10:52