→ LiamIssac: markov decicion process可能會是一種 11/24 17:46
推 haolihy: 很多論文 電機系的朋友有做過類似的 11/24 22:11
論文名稱或關鍵字能提供嗎?
※ 編輯: saltlake (220.136.208.34), 11/24/2017 23:09:22
推 expiate: 蒙地卡羅還有reinforcement learning 11/26 06:03
推 expiate: 當然還有最火熱的deep learning 11/26 06:08
推 expiate: 基本上是不會用窮舉法的,而是用大量的棋譜訓練來獲得模 11/26 06:10
→ expiate: 型 11/26 06:10
推 NCTUFatGuy: RL + MCTS 01/08 10:25