看板 Statistics 關於我們 聯絡資訊
電腦下棋的決策所涉及的數學模式是什麼? 或者說聯繫每一步棋落子的位置之決定和棋盤現有的 敵我棋子分布的數學模型是什麼? 最直觀的是窮舉法 把蒐集得到的各個棋譜的每一步 變化都存到資料庫 下棋的時候在一一比對 但是這樣很花時間不說 萬一出現資料庫存以外的 棋局狀態怎麼辦? 有甚麼書在介紹這方面的嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.208.34 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1511510521.A.6CE.html
LiamIssac: markov decicion process可能會是一種 11/24 17:46
haolihy: 很多論文 電機系的朋友有做過類似的 11/24 22:11
論文名稱或關鍵字能提供嗎? ※ 編輯: saltlake (220.136.208.34), 11/24/2017 23:09:22
expiate: 蒙地卡羅還有reinforcement learning 11/26 06:03
expiate: 當然還有最火熱的deep learning 11/26 06:08
expiate: 基本上是不會用窮舉法的,而是用大量的棋譜訓練來獲得模 11/26 06:10
expiate: 型 11/26 06:10
NCTUFatGuy: RL + MCTS 01/08 10:25