推 guestttttt: 一般影像是RGB三channel, 3d影像是RGBD四channel 04/03 13:13
→ guestttttt: 只是多一個channel, 應該還是用conv2D 04/03 13:14
推 zxp9505007: 3D通常是用來分析點雲圖或是CAD圖 而非影像 04/03 15:14
→ s1010257: 好 謝謝你們的回覆 會在多去了解! 04/03 15:43
推 kaltu: 我覺得決定要用哪種conv的重點是看你希望抽出來的feature是 04/04 01:45
→ kaltu: 幾D 04/04 01:45
→ kaltu: 醫學影像的3D,例如MRI或CT斷層掃出來就是真3D volume HxWx 04/04 01:45
→ kaltu: D,這個時候因為預期的feature會是3D所以就很常用3D卷積保 04/04 01:45
→ kaltu: 留D軸的空間資訊 04/04 01:45
→ kaltu: 所以如果你覺得你的應用,第三軸的空間關係是重要feature的 04/04 01:45
→ kaltu: 話,使用3D卷積不是不行 04/04 01:45
→ kaltu: 順帶一提convXD的X代表的是輸出的shape是filter個X維度的X+ 04/04 01:45
→ kaltu: 1維張量 04/04 01:45
→ kaltu: 像RGB影像做conv2D,kernel其實是3D的,第一層設定5x5 filt 04/04 01:45
→ kaltu: er其實是5x5x3 04/04 01:45
→ kaltu: 舉例來說有些大量filter的conv層後面會有1x1卷積,意思是1x 04/04 01:45
→ kaltu: 1x256之類的把前面長太多的filter壓扁回來 04/04 01:45
→ s1010257: 好,謝謝你詳細的說明^^ 04/22 21:46
→ diabolica: 最近剛好也在思考這種問題 04/22 21:47