→ tsoahans: 可 就找個簡單的CNN範例,把最後一詞改為linear,loss改 05/11 18:57
→ tsoahans: mse 05/11 18:57
→ tsoahans: 層 05/11 18:57
→ kula0000: 感謝,我會試試看 05/11 19:12
天呀,居然是outrunner大大推文<(_ _)> 還假裝新手XDD
※ 編輯: kula0000 (49.159.87.124), 05/12/2018 01:34:58
推 ching0629: 其實我覺得連續預測滿坑的,使用linear output配上rmse 05/13 00:46
→ ching0629: loss的深度網路常常會在訓練過程中預測出離譜的極值, 05/13 00:46
→ ching0629: 導致梯度不穩定,簡單的使用類似relu的限制器又很容易 05/13 00:46
→ ching0629: 截斷梯度,用sigmoid之類的軟限制又很容易梯度消失, 05/13 00:46
→ ching0629: 所以真的很難練到很準。目前主流做法是把這類問題轉成 05/13 00:46
→ ching0629: 多分類問題,這樣能透過比較優雅的方式限制全距,我建 05/13 00:46
→ ching0629: 議可以參考一下別人怎麼透過臉部識別預測年齡的。 05/13 00:46