作者yanwu0105 (輝飛)
看板DataScience
標題[問題] DNN 回歸問題是否需要標準化
時間Wed Dec 19 17:14:50 2018
問題類別:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...)
DNN
使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...)
python
問題內容:
各位大大您好,目前使用DNN對時間序列進行預測
想問一下丟進去模型的訓練資料是否有一定要標準化(Normalization)
如果每個feature的區間範圍不一樣時,肯定需要標準化,
但像是我手邊的資料是銷售額的時間序列資料,這樣是否一定要標準化?
在之前的訓練,會發生predict出來的結果,皆預測成同一個值,
不知道是否是因為訓練資料被標準化到一定範圍,太過接近,
以至於預測結果為同一個值,這樣是否是模型沒學習好?
麻煩各位大大指教,非常感謝!
附上舉例給各位大大參考:
訓練資料有Normalization後的預測結果
[0.838, 0.838, 0.838, 0.838, 0.838,
0.838, 0.838, 0.838, 0.838, 0.838]
訓練資料沒有Normalization,直接丟入模型的結果
[369.643, -1579.206, -1570.955 ,-1001.645, -1721.018,
228.803, -221.869, -1368.03, -1210.812, -225.353]
實際資料:
[-5556.167, -4843.999, -4869.553, -1570.44, 0.0,
-4350.014, 2.387, -3172.07, 0.0, -658.111]
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.119.78.30
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1545210892.A.84A.html
※ 編輯: yanwu0105 (140.119.78.30), 12/19/2018 17:17:25
→ jackwang01: 通常是對feature normalize而不是對label normalize吧 12/19 20:00
→ jackwang01: ?(DNN 的feature我不確定需不需要?) 12/19 20:00
→ ericakcc: 請問是使用DNN一次預測一整條時間序列嗎? 12/19 23:01
→ ericakcc: 我的經驗是DNN對於這種資料很難train的好 12/19 23:02
→ ericakcc: 可以嘗試改成regression的方式(通常需要normalize) 12/19 23:08
推 Kazimir: 我不太相信你有這結果是因為Normalize 建議檢查訓練過程 12/20 01:19
推 tipsofwarren: categorical feature 不用normalize,餘則要。 12/20 10:11
推 zxp9505007: Normalize的結果真的是這樣?建議檢查code 12/23 17:22