看板 Marginalman 關於我們 聯絡資訊
pixel shuffle用在vit架構會出現無法收斂的問題 但用在cnn架構就表現良好 我猜測是學習到的特徵分布的問題 vit是全局特徵 cnn輸出的是局部特徵 我隨便猜的 明天再想想原因 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.179.68 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1760953938.A.034.html
Wardyal: 不用想 it just work 10/20 17:52
sustainer123: 就是不work我才要想 對啊 10/20 17:53