[問題] 電腦決策(下棋 打怪等)

作者saltlake (SaltLake)

看板Statistics

標題[問題] 電腦決策(下棋打怪等)

時間Fri Nov 24 16:01:59 2017

電腦下棋的決策所涉及的數學模式是什麼? 或者說聯繫每一步棋落子的位置之決定和棋盤現有的敵我棋子分布的數學模型是什麼? 最直觀的是窮舉法把蒐集得到的各個棋譜的每一步變化都存到資料庫下棋的時候在一一比對但是這樣很花時間不說萬一出現資料庫存以外的棋局狀態怎麼辦? 有甚麼書在介紹這方面的嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.208.34 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1511510521.A.6CE.html

→ LiamIssac: markov decicion process可能會是一種 11/24 17:46

推 haolihy: 很多論文電機系的朋友有做過類似的 11/24 22:11

論文名稱或關鍵字能提供嗎? ※ 編輯: saltlake (220.136.208.34), 11/24/2017 23:09:22

推 expiate: 蒙地卡羅還有reinforcement learning 11/26 06:03

推 expiate: 當然還有最火熱的deep learning 11/26 06:08

推 expiate: 基本上是不會用窮舉法的，而是用大量的棋譜訓練來獲得模 11/26 06:10

→ expiate: 型 11/26 06:10

推 NCTUFatGuy: RL + MCTS 01/08 10:25