看板 Gossiping 關於我們 聯絡資訊
https://awards.acm.org/about/2024-turing 美國電腦協會ACM決定將資工最高榮譽 2024年圖靈獎 頒給馬薩諸塞大學阿默斯特分校Andrew Barto 和阿爾伯塔大學Richard Sutton 以獎勵這兩位強化學習先驅 他們的百萬美元獎金由Google提供 他們自1980年代起率先構建強化學習的數學基礎 提出時間差分學習、策略梯度方法等核心算法 他們合著的教材《強化學習導論》至今累計被引用79000次 強化學習通過"獎勵-試錯"機制模擬生物學習過程 智能體通過與環境互動不斷優化行為決策 他們通過引入馬爾可夫決策過程理論為強化學習提供強有力的數學框架 現已成為AI系統的核心組件 這成果直接實現了圖靈的機器經驗學習的構想 此算法已成為自動駕駛、晶片設計等領域的關鍵支柱 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.183.28 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1741255436.A.4BE.html
arms6806: http://i.imgur.com/A7BBaj5.jpg 111.241.95.49 03/06 18:04
whiteadam: 賴清118.166.170.112 03/06 18:04
Submariner: 真大師 強化學習一定有看他們的書 42.79.245.189 03/06 18:05
intointo: 666101.138.161.253 03/06 18:05
railman: AI領域神獸223.136.130.204 03/06 18:05
Eligor41: 天才IT大臣咧 101.10.166.89 03/06 18:06
THE7088: 前兩樓是機器推文膩.. 223.137.231.1 03/06 18:06
Busufu: 連我中文系都看過他們的書 223.137.38.83 03/06 18:06
gozule: SUTTON的書學RL必看 36.238.174.132 03/06 18:15