[問題] 關於模型訓練時的影像輸入大小

作者retest75 (再一次)

看板DataScience

標題[問題] 關於模型訓練時的影像輸入大小

時間Thu Apr 25 22:07:01 2024

最近在做些影響辨識的實作想到的一個問題一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸，常見的影像大小大概就256*256 這種等級的尺寸但是現今的圖片大小應該不太可能這麼小吧？如果以真實世界的影像來說，要輸入這類的網路勢必就要做resize的動作但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎？如果是1024*1024調整成256*256，這就直接小了16倍欸一般的貓狗辨識可能不會有太大問題，但如果今天是醫學影像的話，這些遺失資訊搞不好就是對疾病很重要的特徵還是說這種情況可以直接把輸入尺寸打掉重練，按照原始架構重新手刻一個網路然後調整每層的維度以適應新的輸入？目前有想到另一個方法，使用像Unet那種多尺度的方式來做，不知道這可不可行？有爬了一些文但好像都沒有看到類似的應用或文章，所以上來請教大家感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html

推 chang1248w: 我不知道你有多寬，先假設你胸腔是100cmx50cm的巨無 04/26 02:12

→ chang1248w: 霸尺寸好了 04/26 02:12

→ chang1248w: 0.1cm的解析度掃出來的圖像也才1000x500而已喔 04/26 02:15

→ chang1248w: 比起解析度，患者呼吸或顯影劑的影響更大一些，一般 04/26 02:21

→ chang1248w: 比一公分小的腫瘤醫生要認出來就要憑運氣了 04/26 02:21

→ chang1248w: 至於模型，主流的大小是384或224，但是上至512或768 04/26 02:26

→ chang1248w: 的也大有人在，另外transformer 是不受輸入大小影響 04/26 02:26

→ chang1248w: 的 04/26 02:26

→ chang1248w: 受限的只有你的荷包 04/26 02:27

→ chang1248w: 文獻的話 04/26 02:46

→ chang1248w: https://bit.ly/3wk16Qe 04/26 02:46

→ chang1248w: 這篇探討解析度對判症的影響 04/26 02:46

→ chang1248w: 如果你說分類任務不夠好啦，那也有做結核病輔助圈選 04/26 02:50

→ chang1248w: 啊野雞刊 04/26 02:55

推 chang1248w: https://bit.ly/3w8UsfL 04/26 03:04

→ chang1248w: 分類確實有保持在原始尺寸，在512做的傾向 04/26 03:10

→ chang1248w: 你與其擔心單張圖片的解析度，不如擔心第三個維度帶 04/26 03:12

→ chang1248w: 來的尺寸問題 04/26 03:12

→ chang1248w: 這篇survey 做在vit剛問世後幾個月，所以沒有包含相 04/26 03:14

→ chang1248w: 關技術 04/26 03:14

→ chang1248w: 超高解析度收受的只有高頻紋理和比較小的物件，這部 04/26 03:26

→ chang1248w: 分分割比較常出現 04/26 03:26

→ chang1248w: 你想找input size free的模型，現在就是transformer 04/26 03:29

→ chang1248w: 之前continuous kernel之類的工作多半和他們本身一樣 04/26 03:29

→ chang1248w: 冷僻 04/26 03:29

推 fragmentwing: 之前也有想過這個問題但是看到模型裡一大堆的maxpo 04/26 15:14

→ fragmentwing: ol層之後就覺得應該沒想像中嚴重 04/26 15:14

→ fragmentwing: 另外一樓好專業 04/26 15:15

→ truehero: 用crop保持元解析度預測，再把每個slice結果組合回來就 04/28 07:50

→ truehero: 好 04/28 07:50

推 fragmentwing: 樓上這樣要不要再加一組resize縮小的方便捕捉較大的 04/28 18:36

→ fragmentwing: 物體？ 04/28 18:36

→ wuyiulin: 樓上如果分類任務的話可以做多尺度特徵 04/30 15:30