OpenAI發現評測獎勵猜測,促使大型語言模型出現幻覺
https://www.ithome.com.tw/news/171052
「OpenAI提出的解法著重在改變評測與計分,研究人員建議將主要評測指標
改為同時考量準確、錯誤與棄答,把自信且錯誤的回答視為比棄答更嚴重,
並對恰當的不確定表達給予部分積分」
會不會訓練出內向的 AI 呢? :p
--
Say you need M$ with you here, beside you...
anywhere you go, let M$ go too -
, that's all I ask of you...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.161.120.232 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/pighead/M.1757419667.A.9DA.html