看板 DataScience 關於我們 聯絡資訊
作業系統: win10 問題類別: Conv3D 使用工具: keras、tensorflow 問題內容: 最近在翻keras.io文件 看到conv input shape 目前練習的影像辨識圖片都是透過conv2D進行卷積 那如果透過3D攝影機擷取的影像多了縱深的維度是否透過conv3d進行卷積? 對於3d影像的維度其實不是很了解 想請問想法是否正確 或是有沒有一些透過3D影像分析的文章可供參考? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.235.118.45 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1585858737.A.C0E.html
guestttttt: 一般影像是RGB三channel, 3d影像是RGBD四channel 04/03 13:13
guestttttt: 只是多一個channel, 應該還是用conv2D 04/03 13:14
guestttttt: kaggle的文章 https://reurl.cc/E7r87A 04/03 13:16
zxp9505007: 3D通常是用來分析點雲圖或是CAD圖 而非影像 04/03 15:14
s1010257: 好 謝謝你們的回覆 會在多去了解! 04/03 15:43
kaltu: 我覺得決定要用哪種conv的重點是看你希望抽出來的feature是 04/04 01:45
kaltu: 幾D 04/04 01:45
kaltu: 醫學影像的3D,例如MRI或CT斷層掃出來就是真3D volume HxWx 04/04 01:45
kaltu: D,這個時候因為預期的feature會是3D所以就很常用3D卷積保 04/04 01:45
kaltu: 留D軸的空間資訊 04/04 01:45
kaltu: 所以如果你覺得你的應用,第三軸的空間關係是重要feature的 04/04 01:45
kaltu: 話,使用3D卷積不是不行 04/04 01:45
kaltu: 順帶一提convXD的X代表的是輸出的shape是filter個X維度的X+ 04/04 01:45
kaltu: 1維張量 04/04 01:45
kaltu: 像RGB影像做conv2D,kernel其實是3D的,第一層設定5x5 filt 04/04 01:45
kaltu: er其實是5x5x3 04/04 01:45
kaltu: 舉例來說有些大量filter的conv層後面會有1x1卷積,意思是1x 04/04 01:45
kaltu: 1x256之類的把前面長太多的filter壓扁回來 04/04 01:45
s1010257: 好,謝謝你詳細的說明^^ 04/22 21:46
diabolica: 最近剛好也在思考這種問題 04/22 21:47