[問題] yolov3觀念請益

作者rain45 (潤)

看板DataScience

標題[問題] yolov3觀念請益

時間Sun Apr 19 22:23:54 2020

各位大大好，小弟最近在讀CNN和yolov3 在看完論文後，有一些觀念不太確定對不對想請版友糾正: 1.訓練時我們其實在訓練的是每一層的卷積核，也就是所謂的filter(kernel)，讓卷積網路在實際應用時，可以透過這些核得到最大的響應（乘積），請問這樣理解對嗎？ 2.在「訓練」時，物件中心（GT中心）的網格負責預測，而網路學習預測bounding box的偏移量。根據論文可知v3會在三個尺度上做預測，我想請問的是，在「預測未知的圖片」，也就是不是訓練期的時候，是透過darknet-53這個feature extractor卷積後，在三個尺度（8*8、16*16、32*32）的「每一個網格」直接輸出它所預測的偏移量、置信度、類別機率嗎？抱歉第二個問題有點長，主要是想釐清「訓練」跟「推論」階段的一些程序，希望可以為小弟解答，謝謝各位！ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.189.232 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1587306236.A.79E.html

→ jackwang01: 1、2都是，沒錯 04/20 00:20

→ rain45: 了解謝謝您！ 04/20 18:58