[討論] BatchNorm vs InstanceNorm

作者wang19980531 (中立評論員)

看板DataScience

標題[討論] BatchNorm vs InstanceNorm

時間Fri Nov 13 01:10:25 2020

MoCo論文當中有提到BN 可能會藉由計算batch分布以快速達到很好的訓練效果而非真正從資料特徵來學習我把ResNet18每個bn換成instance norm 結果訓練的loss確實有逐步下降，但evaluation的結果顯示很震盪想知道這樣直接換是合理的嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.31.131 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1605201027.A.ECF.html

推 min86615: 如果要做style transfer 是合理的，若是分類問題則不建 11/13 17:37

→ min86615: 議，分類因記憶體限制建議使用GN，說明網路上查都有就不 11/13 17:37

→ min86615: 獻醜了 11/13 17:37

→ wang19980531: 我用GN測試效果也太好了吧謝謝你 11/14 15:17

→ wang19980531: 對了像我要改一個既有的網絡框架像是Resnet18 11/14 15:17

→ wang19980531: 除了一行一行改之外，有沒有其他辦法 11/14 15:17

推 jameschiou: 一般是迴圈的方式建resnet 應該不用單行單行改 11/16 20:53

→ jameschiou: https://reurl.cc/Grv0ZZ 11/16 20:55

推 janus7799: 如果是Tensoflow，1.x版可以建好靜態圖再抽換，2.x版可 11/23 14:24

→ janus7799: 以用clone_model的clone_function直接把layer換掉。其 11/23 14:24

→ janus7799: 他框架應該也能做到，畢竟BN或LN都是簡單的sequential 11/23 14:24

→ janus7799: 連結。 11/23 14:24