[問題] 多個模型比較問題

作者kero961240 (kobe)

看板Statistics

標題[問題] 多個模型比較問題

時間Fri Nov 2 21:20:33 2018

想請問各位大大，目前小弟在工作上用了一個二分類模型預測率來到 90%，但老闆不太滿意，問說假如要99％怎麼辦小弟提出一個想法，目前有三個差不多的模型分別為SVM 深度學習隨機森林都有接近 90% 的準確我倒入一組新的樣本(假設未知標籤），讓三個去辨別，選擇三個模型中最多人判別的結果，再把另一個當作判別錯誤丟進去那個模型的 train data，重新訓練模型，請問這樣是可行的嗎會造成什麼問題嗎？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.92.239 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1541164835.A.7A9.html ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:21:28

→ celestialgod: 試過ensamble沒? 11/02 21:53

c大學長您好，由於在校沒學過您說的，目前沒試過。 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:08 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:22 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:49 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 22:07:50

→ andrew43: 我覺得應該先研究一下在各模型中誤判的樣本有何特徵 11/02 22:21

推 statexpert: Feature多嗎？多的話可能會遇到curse of dimensionali 11/03 21:09

→ statexpert: ty, 這時ensemble會是可能有效解法（同意樓上建議） 11/03 21:09

大大您好，我只能說維度超多，我們根本沒縮減 ※ 編輯: kero961240 (1.172.112.140), 11/03/2018 22:53:06

推 statexpert: 那就ensemble試看看， 11/04 02:54