看板 DataScience 關於我們 聯絡資訊
各位大大好, 最近在研究用YOLOv3處理影像辨識問題 假如我要辨識小物件, 例如:蜜蜂 但是我的traing data嚴重缺乏, 可能只有數十張, 但是其中有些圖片中可能同時出現數 十隻蜜蜂 我的問題如下 : 1. 在幫training data做label時, 假使一張圖中有50隻蜜蜂 1.1 同一張圖, 一次標50個label 1.2 分做50張, 一次標1個label 1.3 分做10張, 一次標5個label 請問上列三種方法, 對訓練結果/收斂速度會有影響嗎? P.S. 我自己測試的結果是, 每張圖都有數隻到數十隻蜜蜂, 我只標其中的數個(沒有 全標)當用training data下去test時, 只會標出我當初有label的那幾隻 但是期望值是其他隻也能辨識出來, 所以我才想說是不是要全標? 2. 當training dtata不足時, 需要再放一些負面data嗎?也就是增加一些沒有labeled的 圖片如果需要, 正負data間的比例抓多少比較好? 3. YOLOv3吃的image size是320x320 ~ 608x608, 所以會先對input data做resize 假如我的影像都是1080P的圖片, 而且待辨識物件都是小物件, resize完是不是更難 extract feature 所以如果怕失真太嚴重, 在丟給YOLO前先做幾層CONV, 透過kernel map壓縮到YOLO可 以吃的大小, 這樣是不是比直接resize好? (觀念有錯請指正, 謝謝) 感謝賜教 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.176.75 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1547134029.A.D81.html
jackwang01: 可能overfit 有點嚴重,多一些訓練資料比較好,再來這 01/10 23:49
jackwang01: 種問題我是沒看過有人放負面資料的?畢竟這是object d 01/10 23:49
jackwang01: etection不是classification 01/10 23:49
jackwang01: 比較建議一張照片裡面能標的盡量標,然後張數越多越好 01/10 23:51
jackwang01: ,再來就是測試的時候用測試資料來看而不是用訓練資 01/10 23:51
jackwang01: 料 01/10 23:51
oe725: 想說先用training data確認一下有無underfiting 01/11 00:51
kokolotl: 請問這種狀況適合把大張圖切成小張圖來做嗎 01/11 07:49
kyushu: 以yolo來說,non-object 就是negative了 01/11 19:25
kyushu: 你用yolo3,基本上小物件的準確率會比較好,trainging跟in 01/11 19:29
kyushu: ference用608或544的size對小物件也會有所提升 01/11 19:29
truehero: 全標, random crop ,總數千隻蜜蜂辨識率應該不會太低 01/12 20:40
lunashining: 借問是不是只有mask_rcnn 不適合切小張圖,其他的OD 01/14 09:33
lunashining: 都比較適合切小張 好比人臉只切臉之類的 01/14 09:33
oe725: 針對問題1有大能有建議嗎?謝謝 01/14 22:19
followwar: 上面有人說阿 全標+random crop 01/15 01:03
oe725: 我是比較想了解training時,一張大圖跟切成數張小圖有無差異 01/15 21:15
lunashining: 如果物體很小 random crop剛好只切到一小部分去train 01/16 09:56
lunashining: 不會有問題嗎? 01/16 09:57
truehero: 半隻蜜蜂還是蜜蜂阿 01/18 23:45
Mchord: 根據ssd的random crop規則,每個被切到的東西都不能被切 01/24 07:36
Mchord: 掉太多,否則不採用,再重新切過。 01/24 07:36