[問題] conv3D

作者s1010257 (波)

看板DataScience

標題[問題] conv3D

時間Fri Apr 3 04:18:55 2020

作業系統: win10 問題類別: Conv3D 使用工具: keras、tensorflow 問題內容: 最近在翻keras.io文件看到conv input shape 目前練習的影像辨識圖片都是透過conv2D進行卷積那如果透過3D攝影機擷取的影像多了縱深的維度是否透過conv3d進行卷積？對於3d影像的維度其實不是很了解想請問想法是否正確或是有沒有一些透過3D影像分析的文章可供參考？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.235.118.45 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1585858737.A.C0E.html

推 guestttttt: 一般影像是RGB三channel, 3d影像是RGBD四channel 04/03 13:13

→ guestttttt: 只是多一個channel, 應該還是用conv2D 04/03 13:14

→ guestttttt: kaggle的文章 https://reurl.cc/E7r87A 04/03 13:16

推 zxp9505007: 3D通常是用來分析點雲圖或是CAD圖而非影像 04/03 15:14

→ s1010257: 好謝謝你們的回覆會在多去了解！ 04/03 15:43

推 kaltu: 我覺得決定要用哪種conv的重點是看你希望抽出來的feature是 04/04 01:45

→ kaltu: 幾D 04/04 01:45

→ kaltu: 醫學影像的3D，例如MRI或CT斷層掃出來就是真3D volume HxWx 04/04 01:45

→ kaltu: D，這個時候因為預期的feature會是3D所以就很常用3D卷積保 04/04 01:45

→ kaltu: 留D軸的空間資訊 04/04 01:45

→ kaltu: 所以如果你覺得你的應用，第三軸的空間關係是重要feature的 04/04 01:45

→ kaltu: 話，使用3D卷積不是不行 04/04 01:45

→ kaltu: 順帶一提convXD的X代表的是輸出的shape是filter個X維度的X+ 04/04 01:45

→ kaltu: 1維張量 04/04 01:45

→ kaltu: 像RGB影像做conv2D，kernel其實是3D的，第一層設定5x5 filt 04/04 01:45

→ kaltu: er其實是5x5x3 04/04 01:45

→ kaltu: 舉例來說有些大量filter的conv層後面會有1x1卷積，意思是1x 04/04 01:45

→ kaltu: 1x256之類的把前面長太多的filter壓扁回來 04/04 01:45

→ s1010257: 好，謝謝你詳細的說明^^ 04/22 21:46

→ diabolica: 最近剛好也在思考這種問題 04/22 21:47