[問題] 請問有人能用policy gradient的方法(vani

作者yuwenche (yuwenche)

看板DataScience

標題[問題] 請問有人能用policy gradient的方法(vani

時間Fri Sep 3 09:04:04 2021

請問有人能用policy gradient的方法(vanilla, TRPO, PPO等)成功解決"MountainCar-v0" 問題嗎? 或這問題只能用value learning methods(DQN,DRQN,GAIL等)才能解出? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.114.162 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1630631046.A.69E.html

→ kriswu8021: 這次有獎金嗎？xD 09/03 13:55

→ yuwenche: 是用TRPO解嗎? 09/04 13:12