作者sustainer123 (溫水佳樹的兄長大人)
看板Marginalman
標題紀錄一下
時間Mon Oct 20 17:52:16 2025
pixel shuffle用在vit架構會出現無法收斂的問題
但用在cnn架構就表現良好
我猜測是學習到的特徵分布的問題
vit是全局特徵 cnn輸出的是局部特徵
我隨便猜的
明天再想想原因
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.179.68 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1760953938.A.034.html
→ Wardyal: 不用想 it just work 10/20 17:52
→ sustainer123: 就是不work我才要想 對啊 10/20 17:53