看板 DataScience 關於我們 聯絡資訊
最近在做些影響辨識的實作想到的一個問題 一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸,常見的影像大小大概就256*256 這種等級的尺寸 但是現今的圖片大小應該不太可能這麼小吧? 如果以真實世界的影像來說,要輸入這類的網路勢必就要做resize的動作 但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎? 如果是1024*1024調整成256*256,這就直接小了16倍欸 一般的貓狗辨識可能不會有太大問題,但如果今天是醫學影像的話,這些遺失資訊搞不好就 是對疾病很重要的特徵 還是說這種情況可以直接把輸入尺寸打掉重練,按照原始架構重新手刻一個網路然後調整每 層的維度以適應新的輸入? 目前有想到另一個方法,使用像Unet那種多尺度的方式來做,不知道這可不可行? 有爬了一些文但好像都沒有看到類似的應用或文章,所以上來請教大家 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html
chang1248w: 我不知道你有多寬,先假設你胸腔是100cmx50cm的巨無 04/26 02:12
chang1248w: 霸尺寸好了 04/26 02:12
chang1248w: 0.1cm的解析度掃出來的圖像也才1000x500而已喔 04/26 02:15
chang1248w: 比起解析度,患者呼吸或顯影劑的影響更大一些,一般 04/26 02:21
chang1248w: 比一公分小的腫瘤醫生要認出來就要憑運氣了 04/26 02:21
chang1248w: 至於模型,主流的大小是384或224,但是上至512或768 04/26 02:26
chang1248w: 的也大有人在,另外transformer 是不受輸入大小影響 04/26 02:26
chang1248w: 的 04/26 02:26
chang1248w: 受限的只有你的荷包 04/26 02:27
chang1248w: 文獻的話 04/26 02:46
chang1248w: https://bit.ly/3wk16Qe 04/26 02:46
chang1248w: 這篇探討解析度對判症的影響 04/26 02:46
chang1248w: 如果你說分類任務不夠好啦,那也有做結核病輔助圈選 04/26 02:50
chang1248w: 啊 野雞刊 04/26 02:55
chang1248w: https://bit.ly/3w8UsfL 04/26 03:04
chang1248w: 分類確實有保持在原始尺寸,在512做的傾向 04/26 03:10
chang1248w: 你與其擔心單張圖片的解析度,不如擔心第三個維度帶 04/26 03:12
chang1248w: 來的尺寸問題 04/26 03:12
chang1248w: 這篇survey 做在vit剛問世後幾個月,所以沒有包含相 04/26 03:14
chang1248w: 關技術 04/26 03:14
chang1248w: 超高解析度收受的只有高頻紋理和比較小的物件,這部 04/26 03:26
chang1248w: 分分割比較常出現 04/26 03:26
chang1248w: 你想找input size free的模型,現在就是transformer 04/26 03:29
chang1248w: 之前continuous kernel之類的工作多半和他們本身一樣 04/26 03:29
chang1248w: 冷僻 04/26 03:29
fragmentwing: 之前也有想過這個問題 但是看到模型裡一大堆的maxpo 04/26 15:14
fragmentwing: ol層之後就覺得 應該沒想像中嚴重 04/26 15:14
fragmentwing: 另外一樓好專業 04/26 15:15
truehero: 用crop保持元解析度預測,再把每個slice結果組合回來就 04/28 07:50
truehero: 好 04/28 07:50
fragmentwing: 樓上這樣要不要再加一組resize縮小的方便捕捉較大的 04/28 18:36
fragmentwing: 物體? 04/28 18:36
wuyiulin: 樓上如果分類任務的話可以做多尺度特徵 04/30 15:30