看板 Statistics 關於我們 聯絡資訊
想請問各位大大,目前小弟在工作上用了一個二分類模型 預測率來到 90%,但老闆不太滿意,問說假如要99% 怎麼辦 小弟提出一個想法,目前有三個差不多的模型 分別為SVM 深度學習 隨機森林 都有接近 90% 的準確 我倒入一組新的樣本(假設未知標籤),讓三個去辨別, 選擇三個模型中最多人判別的結果,再把另一個當作判別錯誤 丟進去那個模型的 train data,重新訓練模型,請問這樣是可行的嗎 會造成什麼問題嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.92.239 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1541164835.A.7A9.html ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:21:28
celestialgod: 試過ensamble沒? 11/02 21:53
c大學長您好,由於在校沒學過您說的,目前沒試過。 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:08 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:22 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:49 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 22:07:50
andrew43: 我覺得應該先研究一下在各模型中誤判的樣本有何特徵 11/02 22:21
statexpert: Feature多嗎?多的話可能會遇到curse of dimensionali 11/03 21:09
statexpert: ty, 這時ensemble會是可能有效解法(同意樓上建議) 11/03 21:09
大大您好,我只能說維度超多,我們根本沒縮減 ※ 編輯: kero961240 (1.172.112.140), 11/03/2018 22:53:06
statexpert: 那就ensemble試看看, 11/04 02:54