推 sma1033: 已經收斂了所以停止上升? 08/22 01:00
→ Activation: 有沒有可能train的上去又收斂快? 我才疏學淺 08/22 01:05
→ yoyololicon: 多小?參數量? 08/22 07:18
推 sma1033: 如果連training的performance都差,可能資料或是model本 08/22 12:22
→ sma1033: 來就有問題,比方說 「Model太小」或是「model太大」都算 08/22 12:23
→ p193202: model capacity 小,要找的最佳 function 不在 model 裡 08/22 19:27
→ p193202: 面 08/22 19:27
→ atrix: 舉個例來說:若有個vgg模型只有一層卷積, 08/25 23:13
→ atrix: 分類imagenet的準確率不會高到哪去。 08/25 23:13
→ atrix: 但拿比vgg19要小的vgg16來比較, 08/25 23:13
→ atrix: 收斂的有比較快,準確率也差不多。 08/25 23:13
→ atrix: 所以得先確定小模型能收斂到什麼程度再比較 08/26 00:05
→ Activation: 了解 謝謝各位 08/28 02:31