看板 DataScience 關於我們 聯絡資訊
各位大大好,小弟最近在讀CNN和yolov3 在看完論文後,有一些觀念不太確定對不對 想請版友糾正: 1.訓練時我們其實在訓練的是每一層的卷積核,也就是所謂的filter(kernel),讓卷積網 路在實際應用時,可以透過這些核得到最大的響應(乘積),請問這樣理解對嗎? 2.在「訓練」時,物件中心(GT中心)的網格負責預測,而網路學習預測bounding box的 偏移量。根據論文可知v3會在三個尺度上做預測,我想請問的是,在「預測未知的圖片」 ,也就是不是訓練期的時候,是透過darknet-53這個feature extractor卷積後,在三個 尺度(8*8、16*16、32*32)的「每一個網格」直接輸出它所預測的偏移量、置信度、類 別機率嗎? 抱歉第二個問題有點長,主要是想釐清「訓練」跟「推論」階段的一些程序,希望可以為 小弟解答,謝謝各位! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.189.232 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1587306236.A.79E.html
jackwang01: 1、2都是,沒錯 04/20 00:20
rain45: 了解 謝謝您! 04/20 18:58