看板 DataScience 關於我們 聯絡資訊
用GAIL(Generative Adversarial Imitation Learning)及Pytorch解出MountainCar-v0 , 賞金五千元。 使用原始的TRPO或PPO來訓練policy均可,也可將原始的GAN換成Wasserstein GAN 。 底 下連結可供參考,至少專家軌跡是可用的。 一旦成功完成,請寄給我結果和部份程式的截圖,我就會將錢匯入指定帳戶,然後再把原 始碼寄給我即可。 https://github.com/alanyuwenche/GAIL_MountainCar_CartPole -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.161.187 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1608702686.A.04C.html
kriswu8021: 私訊囉 12/23 21:05
yuwenche: 交易完成,問題已解決 12/25 09:03