看板 DataScience 關於我們 聯絡資訊
我的教授上課時剛好有講到, 控制系統跟RL上的控制其實就是兩班不一樣的人研究同一樣東西. 基本上就是學術CS那一掛人跟工程師在分別研究控制系統(角度是不一樣啦) 大約過了20年才發現,結果就是現在很多明明在講差不多東西的公式 有兩套用語跟符號去代表.最近幾年聽說兩邊的學術界有在交流說要把它們整合. 可是速度應該是超級慢,以年為單位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 138.40.67.171 ※ 文章網址: https://www.ptt.cc/bbs/deeplearning/M.1520866871.A.684.html
goldflower: RL做控制已經是很小部分了 我猜會是控制跳去RL 03/12 23:51
EGsux: 不知道 我也不是做控制的xd 只是聽故事QQ 03/13 00:28
zxp9505007: rl跟控制是完全不一樣的東西 RL比較偏決策 控制還是 03/14 09:43
zxp9505007: 建模為主 03/14 09:43
goldflower: 我覺得沒到完全不一樣啦 rl的policy可以包含控制啊 03/14 15:59
goldflower: 不過rl的控制現在還是蠻廢的樣子 一段時間沒追了 03/14 16:00
EGsux: rl是可以做控制阿 只是model free控制跟有model比的太爛 03/15 04:02
EGsux: 用不了在商用 03/15 04:02