推 aaaba: 差在machine "learning"02/28 06:26
請問你的意思是?能不能說的清楚點呢?
推 NBAPredictor: 覺得沒什麼差 控制理論很多model-based+Heuristic 02/28 10:41
※ 編輯: PyTorch (223.136.36.156), 02/28/2018 13:39:45
→ aaaba: 控制系統的回授調整過程是在runtime,怎麼調整稱為policy 02/28 15:02
→ aaaba: 而RL的policy是學來的,傳統控制的policy是人學完再告訴機 02/28 15:04
→ aaaba: 器 02/28 15:04
→ PyTorch: 現在樓上詳細的解說 03/01 01:21
→ PyTorch: 謝謝 03/01 12:00
→ patrick2dot0: RL是解決控制問題的方法之一 03/01 12:27
→ patrick2dot0: 但RL不只可以解決控制的問題 03/01 12:28
→ patrick2dot0: 控制也不是只有RL的方法 03/01 12:28
→ patrick2dot0: 透過feedback跟reward的相似性 03/01 12:29
→ patrick2dot0: 可以讓兩個領域互相有關聯 03/01 12:31