看板 Gossiping 關於我們 聯絡資訊
https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825395 研究團隊隨機從史丹佛大學、維吉尼亞大學等機構招募了50名醫生,其中包括44名內科醫 生、5名急診醫生和1名家庭醫生,總共26名主治醫師和24名住院醫生。研究團隊接著再從 90年代以來的105個經典病例中進行了選擇和改編。所有病例均來自真實病人但最終診斷結 果從未公開,這樣醫生和ChatGPT都無法預先知曉答案。4位專業醫師選出6個最終入選病例 給受試者一個小時做判斷。 研究團隊使用提示工程框架,迭代開發了一個最優的0樣本提示,其中包含了任務細節、背 景、指示等關鍵要素,且每個病例使用相同提示。研究員會將優化後提示連同病例內容輸 入ChatGPT,每個病例獨立運行三次。研究員不對ChatGPT的輸出做任何人工修改直接交給 評分者一起盲評,評分者也不知道哪些結果由ChatGPT產生。 結果ChatGPT得到的診斷得分中位數高達92%,明顯高於人類醫生對照組,且p值為0.03,具 有統計意義。需要注意的是,這些病例經過人類臨床醫生篩選和總結,已經對提取關鍵資 訊。在實際臨床中,獲取資訊的過程更加複雜,因此實驗結果並不代表大模型能在臨床中 取代人類。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.154.141 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1731927902.A.6BA.html
HodorDragon: 很正常啊 就是看症狀來篩選啊 61.58.97.52 11/18 19:05
Osmium: 正常發揮 111.83.249.235 11/18 19:05
orfan: 你是看哪一段得到你標題結論????? 111.71.47.70 11/18 19:06
※ 編輯: jackliao1990 (111.253.154.141 臺灣), 11/18/2024 19:06:58
guanluvsquat: "在實際臨床中,獲取資訊的過程更加220.143.196.118 11/18 19:06
guanluvsquat: 複雜,因此實驗結果並不代表大模型220.143.196.118 11/18 19:06
guanluvsquat: 能在臨床中取代人類。"220.143.196.118 11/18 19:06
mithralin: 這不是廢話嗎。這就像餵一堆棋譜給AI 111.71.13.239 11/18 19:06
mithralin: 跟人類,然後比較誰的下期走法勝率較 111.71.13.239 11/18 19:06
mithralin: 高 111.71.13.239 11/18 19:07
bingripplw: 他的能力就來自於做出正確決定的人106.107.130.137 11/18 19:07
bingripplw: 阿106.107.130.137 11/18 19:07
mithralin: 現實生活上,你去跟醫生說頭痛,醫生 111.71.13.239 11/18 19:08
mithralin: 也要做很多檢查去觀察哪裡有毛病 111.71.13.239 11/18 19:08
Gallardo: 贏波波醫生也在吹喔? 36.234.212.195 11/18 19:08
adon0313: 難道你圍棋能贏電腦 116.89.142.6 11/18 19:10
theshape87: 奇怪,點進去的key point跟abstract 118.161.72.117 11/18 19:12
theshape87: 都不符合妳的標題論述耶,我覺得你的 118.161.72.117 11/18 19:12
theshape87: 標題過於武斷 118.161.72.117 11/18 19:12
y120196276: 因為餵給他的資訊是正確資訊吧?實際 223.136.147.32 11/18 19:13
y120196276: 上看醫生,一堆老人連自己怎樣不舒服 223.136.147.32 11/18 19:13
y120196276: 都說不清楚,他說頭痛,結果其實是肩 223.136.147.32 11/18 19:13
y120196276: 膀酸痛 223.136.147.32 11/18 19:13
baboosh: GPT 的庫存病例肯定超過個人醫生經驗 223.137.6.46 11/18 19:13
adon0313: 初步判定 再給真人確認就省一堆人力了 116.89.142.6 11/18 19:14
glen3310: ai可以幫助醫生更快篩選症狀 122.116.131.56 11/18 19:14
widec: 不只庫存病例多,它同時能聯想到的記憶也多 1.165.4.84 11/18 19:14
mnb1234: 醫生會要立法阻擋這一切111.250.210.188 11/18 19:17
dayend: 這不希奇 光是知識資料庫 就比醫生強^^ 103.59.108.107 11/18 19:17
paul10404: 給機器人看就好,有問題去告工程師 27.52.231.70 11/18 19:19
laser789: 內文無顯著差異 結論哪來的 台灣記者? 1.200.19.136 11/18 19:25
那是研究團隊做的另一個實驗 實驗組(有CHATGPT輔助的人類醫生)VS 對照組純人類診斷 結果顯示 人機合作的診斷成功率沒有比較好 結論:純CHATGPT診斷正確率>>人機合作診斷正確率=純人類診斷正確率
catwithptt: 這樣很好啊 1.173.128.87 11/18 19:32
matlab1106: 白癡 貴的是誰負責 以為都像妓者喔 36.236.8.193 11/18 19:39
※ 編輯: jackliao1990 (111.253.154.141 臺灣), 11/18/2024 19:46:45
darkMood: 不意外啊,因為chatGpt都人類知識都吸乾 175.182.28.76 11/18 20:47
darkMood: 了啊,已知知識上超越人類很正常啊 175.182.28.76 11/18 20:47