看板 DataScience 關於我們 聯絡資訊
網路上有些別人寫好的網站,可以上傳圖片就即時幫你用神經網路做出處理後的成果 譬如Waifu2x等 但是他們通常沒有規定死輸入影像的長寬pixels 自己做作業是都要固定輸入影像大小如512*512 才能吐output 因為convolution NN就是按input影像大小去寫死filter size跟padding的 請問實用上CNN是怎麼解決input影像大小可能不固定的問題呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.25.187 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1527631724.A.A2B.html
qwerty9876c: spatial pyramid pooling或global average pooling 05/30 07:23
qwerty9876c: 可以參考看看 05/30 07:23
Mchord: 不想resize input的話就不要用inner product 05/30 07:37
yougigun: 推一樓 05/30 08:51
germun: 通常就直接resize 看是bicubic還是內插什麼的就看人 05/30 20:49
lunashining: resize不會把一些小特徵消掉嗎?有些像病徵 瑕疵不是 05/30 23:06
lunashining: 都才幾個pixel 05/30 23:07
sma1033: 建議直接去看R-CNN, Yolo or SSD這種物件追蹤的相關Paper 05/31 01:48
sma1033: 你提的這個問題,沒有很簡單效能又好的方法 05/31 01:49
sma1033: 影像的物件偵測也算是一個特殊獨門技術,並不是很容易 05/31 01:50
sma1033: 同時要考慮到影像的變形以及大小問題,本來就是不容易啊 05/31 01:52
NMOSFET: 訓練的時候每個epoch隨機改變輸入圖片的大小,參考YOLOV2 06/03 19:45
uloyoy: 1樓的那個比較接近要擷取不同大小範圍的特徵吧? 06/07 15:30
HEroKuma: 限制大小是因為最後有full connect才要限制吧 06/10 08:48
HEroKuma: 如果你的網路是FCN就沒問題啦 06/10 08:49