看板 SENIORHIGH 關於我們 聯絡資訊
誰是最強考生?ChatGPT、Gemini挑戰115學測 這款AI「幾乎全對」根本是學霸 2026-01-19 18:03 聯合新聞網 綜合報導 連考3天的115學年度大學學測今日落幕,補教業 者會在各科考後提供參考解答。為實驗AI解題, 《聯合新聞網》將大考中心網站提供的115年學測試 題pdf檔分別上傳至現在主流的兩大AI:ChatGPT 和Gemini,請它們給出解答,並以補教業者的參考 解答為基準,檢視AI解題正確率。 操作方法:將大考中心網站提供的115年學測試題 pdf檔分別上傳至付費版ChatGPT和付費版 Gemini,指令為「請給我各題答案/解答」。 數A、自然、英文皆在得勝者文教公布參考解答 後,才上傳試題請AI解答;國綜、數B、社會調 整時間,在得勝者文教公布參考解答前,就先上 傳試題給AI。 實測結果曝光!ChatGPT錯一堆、Gemini「準確 度令人驚艷」 數學A ChatGPT:GPT只有單選3題和得勝者參考解答 相同,其他單選題、多選題和手寫計算題和參考 解答完全不同。 Gemini:僅多選第11、12題、手寫計算第13題和 得勝者文教參考答案不同,請它重算後有改正多選 第11題。 自然科 Gemini讀取許久後取消對話,完全無回應; ChatGPT則是卡很久後,給出參考網路上(得勝者 文教)的解答。猜測可能是自然科圖表題占多數, AI較無法判讀。 英文科 ChatGPT和Gemini兩者提供的解答都和得勝者文 教並無太大差異,僅題組第38題圖片題與參考解 答不同。單獨擷取圖片請ChatGPT和Gemini再回 答一次,仍與參考解答不符。 國文科(國綜) ChatGPT:單選題第2、4、10、12、15、24題、 多選題第25、29、30、31題與參考解答不同。 Gemini:單選題第12、14題、多選題組27~30題 與參考解答不同,請它再確認後,有改正單選第12 題、多選第28題。 數學B ChatGPT:僅單選2題、混合1題和參考解答相 同,其餘完全不同。 Gemini:與參考解答相比僅單選第6題不同,請 它重算後有改正。 社會科 ChatGPT:讀取許久後仍無法給出解答,甚至要 求使用者提供正確答案,表示由於社會科包含情境 判讀、圖表、推論等,若硬要回答可能錯誤過多。 Gemini:選擇題第8、11、16、19、25、36與參 考解答不同,請它再確認後,僅改正第8題。 綜合來看,Gemini的回答正確率比ChatGPT高非 常多,只是圖表可能會讓AI較混淆,例如Gemini 完全讀不出自然科解題,社會科錯誤數量偏高; ChatGPT則是直接提供自然科的網路參考答案, 未自行做題,社會科也直說由於包含多種題型,因 此無法回答,猜測AI可能較不擅長判讀圖表題和多 選題。 https://udn.com/news/amp/story/124703/9274692 ——————- 自然科完全呆住,這怎麼回事? 至少要手動貼文字題和附圖檔給AI再試一次吧 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.132.181.237 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/SENIORHIGH/M.1768869506.A.825.html
xul327: 有試過用AI做數學錯題本 圖形讀不出來 G要轉成圖片才好點 01/20 12:14
xul327: 圖形類還是自己手繪比較快 01/20 12:15
lovehan: 影印就好…… 01/20 13:55
Meaverzt: 給檔案的截圖gpt可以幾乎都對 01/21 09:43
Meaverzt: 連大學訊系機率都會算了 01/21 09:43
Meaverzt: 不可能學測的不會吧 01/21 09:43
goshfju: ChatGPT解數理相關題目蠻硬凹的 01/22 08:37