看板 DataScience 關於我們 聯絡資訊
門外漢有個問題, 假設我打算用 a,b,c 三個變數 使用 DNN or LR 來 預測 y 我先檢查 a,y 的 coefficient, 結果發覺是 0, 那我想, 把 a 從 feature set 剔除 應該是很保險的. 但是, 如果我打算用 時間序列模型 來做訓練, 換句話說, a,b,c 的時間序列 來預測 y 那用 單純的 coefficient (a,y) 來檢查 a(n) 是否可以踢除 feature set 是否不對? 用白話的來說, 如果 (a,y) 沒有相關性, 是否代表 a(n) 與 y 的相關性也是 0? 如果這個推論是不成立的, 那麼我該用什麼樣的方法來檢驗 a(n) 是否適合加入 LSTM 訓練的 feature set ? 感謝解惑 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.85.189 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1550067150.A.79C.html
yougigun: 就算correlation 為 0 也不能拿掉 a 文章以下問題 就不02/14 09:13
yougigun: 存在了02/14 09:13
yougigun: a(n) 重要性,應該是看a(n)與b(n)and a(n)與c(n) ,如果02/14 12:59
yougigun: 其他特徵(b,c)跟它(a)相關性高,為了讓特徵變少,是可以02/14 12:59
yougigun: 去掉a只看b,c組合,但單純只看a與y的correlation,可能會02/14 12:59
yougigun: 因為沒有捕捉到a的高階特徵導致a與y相關性0,但說不定a^202/14 12:59
yougigun: 與y 是高度正相關 所以才會需要DNN去捕捉高階特徵02/14 12:59
感謝指點。。。 ※ 編輯: tipsofwarren (42.73.246.102), 02/14/2019 14:26:28