看板 DataScience 關於我們 聯絡資訊
板上的各位好,想詢問幾個與Yolo相關的問題 目前手上的圖檔大小約為60000*60000的超大圖 而在做標記的時候也是直接針對整張超大圖做標記 但在訓練時不太可能直接將整張圖丟進去train 1. 所以想問第一個問題 假設我將圖檔切成一張一張1024*1024的小圖,那label的部分該怎麼處理? 例如下圖:在切小圖的時候並無法涵蓋到整個label的區域 所以以圖1來說label的部分就會變成是整個右下角,圖2則為整個左下角對嗎? https://i.imgur.com/KrfEslQ.png
2. 第二個問題 當我在切小圖時並不會所有的小圖都有標記的區域 所以這樣在存annotation的xml檔時,是不是該張圖就不需要對應的xml檔? 還是也需要只是邊界的部分都填0之類的? 不好意思,再麻煩板上的高手幫忙解答了!謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.14.191.156 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1591595345.A.EEC.html
magic83v: 對圖片resize呢? 標出box的部分再放大回原圖 06/08 19:10
這方法目前應該不考慮,因為圖片數量也才300張左右,resize會讓資料量不足 且容易失焦?
CaptPlanet: 第一個問題 你的想法沒錯 要注意的是分割前處理流程要 06/09 17:41
CaptPlanet: 固定好 這樣就把問題轉換成訓練一個對子圖偵測的模型 06/09 17:41
CaptPlanet: 第二個問題 切小圖可能會產生大量 negative data 需要 06/09 17:44
CaptPlanet: 注意 negative 跟 positive samples 的比例 (資料平 06/09 17:44
CaptPlanet: 衡的問題)若像 SSD 這種的就有 hard negative mining 06/09 17:44
CaptPlanet: 機制 比例是1:3就不用放沒目標物的圖片 可以參考看 06/09 17:44
CaptPlanet: 看 06/09 17:44
了解,謝謝C大說明,確實沒想到會造成比例偏差的問題 那請問沒有目標物的圖片也會需要相對應的xml檔嗎? ※ 編輯: andy086 (163.14.43.88 臺灣), 06/09/2020 18:05:22