[問題] object detect(YOLO)相關問題

作者oe725 ( )

看板DataScience

標題[問題] object detect(YOLO)相關問題

時間Thu Jan 10 23:27:07 2019

各位大大好, 最近在研究用YOLOv3處理影像辨識問題假如我要辨識小物件, 例如:蜜蜂但是我的traing data嚴重缺乏, 可能只有數十張, 但是其中有些圖片中可能同時出現數十隻蜜蜂我的問題如下 : 1. 在幫training data做label時, 假使一張圖中有50隻蜜蜂 1.1 同一張圖, 一次標50個label 1.2 分做50張, 一次標1個label 1.3 分做10張, 一次標5個label 請問上列三種方法, 對訓練結果/收斂速度會有影響嗎? P.S. 我自己測試的結果是, 每張圖都有數隻到數十隻蜜蜂, 我只標其中的數個(沒有全標)當用training data下去test時, 只會標出我當初有label的那幾隻但是期望值是其他隻也能辨識出來, 所以我才想說是不是要全標? 2. 當training dtata不足時, 需要再放一些負面data嗎?也就是增加一些沒有labeled的圖片如果需要, 正負data間的比例抓多少比較好? 3. YOLOv3吃的image size是320x320 ~ 608x608, 所以會先對input data做resize 假如我的影像都是1080P的圖片, 而且待辨識物件都是小物件, resize完是不是更難 extract feature 所以如果怕失真太嚴重, 在丟給YOLO前先做幾層CONV, 透過kernel map壓縮到YOLO可以吃的大小, 這樣是不是比直接resize好? (觀念有錯請指正, 謝謝) 感謝賜教 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.176.75 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1547134029.A.D81.html

→ jackwang01: 可能overfit 有點嚴重，多一些訓練資料比較好，再來這 01/10 23:49

→ jackwang01: 種問題我是沒看過有人放負面資料的？畢竟這是object d 01/10 23:49

→ jackwang01: etection不是classification 01/10 23:49

→ jackwang01: 比較建議一張照片裡面能標的盡量標，然後張數越多越好 01/10 23:51

→ jackwang01: ，再來就是測試的時候用測試資料來看而不是用訓練資 01/10 23:51

→ jackwang01: 料 01/10 23:51

→ oe725: 想說先用training data確認一下有無underfiting 01/11 00:51

推 kokolotl: 請問這種狀況適合把大張圖切成小張圖來做嗎 01/11 07:49

推 kyushu: 以yolo來說，non-object 就是negative了 01/11 19:25

推 kyushu: 你用yolo3，基本上小物件的準確率會比較好，trainging跟in 01/11 19:29

→ kyushu: ference用608或544的size對小物件也會有所提升 01/11 19:29

→ truehero: 全標, random crop ,總數千隻蜜蜂辨識率應該不會太低 01/12 20:40

推 lunashining: 借問是不是只有mask_rcnn 不適合切小張圖,其他的OD 01/14 09:33

→ lunashining: 都比較適合切小張好比人臉只切臉之類的 01/14 09:33

→ oe725: 針對問題1有大能有建議嗎?謝謝 01/14 22:19

→ followwar: 上面有人說阿全標+random crop 01/15 01:03

→ oe725: 我是比較想了解training時,一張大圖跟切成數張小圖有無差異 01/15 21:15

推 lunashining: 如果物體很小 random crop剛好只切到一小部分去train 01/16 09:56

→ lunashining: 不會有問題嗎? 01/16 09:57

→ truehero: 半隻蜜蜂還是蜜蜂阿 01/18 23:45

→ Mchord: 根據ssd的random crop規則，每個被切到的東西都不能被切 01/24 07:36

→ Mchord: 掉太多，否則不採用，再重新切過。 01/24 07:36