看板 R_Language 關於我們 聯絡資訊
[問題類型]: 意見調查(我對R 有個很棒的想法,想問問大家的意見) 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 請把以下不需要的部份刪除 使用者(已經有用R 做過不少作品) [問題敘述]: 抱歉有一些關於randomforest使用上的問題想要問一下 目前我使用randomForest這個套件去訓練我的樹 然後想要使用https://github.com/araastat/reprtree/tree/master/R 上面那個套件的retree畫出我的樹 但是遇到了一些問題 訓練組跟測試組所畫的樹不一樣 以及如果我現在是想要做隨機森林的特徵選取 那我該如何下手因為用不同的資料所會出的樹不一樣 [程式範例]: 請把以下不需要的部份刪除 library(reprtree) rforest <- randomForest(type~., data=train_data) reptree <- ReprTree(rforest, train_data, metric='d2') plot(reptree, index=1) reptree <- ReprTree(rforest, test_data, metric='d2') plot(reptree, index=1) [環境敘述]: R version 3.4.1 (2017-06-30) Platform: x86_64-pc-linux-gnu (64-bit) Running under: Ubuntu 16.04.3 LTS Matrix products: default BLAS: /usr/lib/libblas/libblas.so.3.6.0 LAPACK: /usr/lib/lapack/liblapack.so.3.6.0 locale: [1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C LC_TIME=zh_TW.UTF-8 [4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8 LC_MESSAGES=zh_TW.UTF-8 [7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C LC_ADDRESS=C [10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8 LC_IDENTIFICATION=C attached base packages: [1] stats graphics grDevices utils datasets methods base loaded via a namespace (and not attached): [1] compiler_3.4.1 tools_3.4.1 [關鍵字]: 隨機森林、特徵選取、繪圖 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.125.96.131 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1506524943.A.391.html
f496328mm: 為什麼要建兩次 model ? 09/27 23:35
hatemath1991: 抱歉我不是只用randomForest創一次model嘛? 09/27 23:37
f496328mm: 應該是說 為什麼要分別對對 train and test 畫樹 09/27 23:51
f496328mm: 建 model 時, 是利用 train data 去建立樹model 09/27 23:52
f496328mm: 所以整個結構是看 train data 09/27 23:54
hatemath1991: 應該說這個是因為有一天打錯所以才發現的 09/28 00:00
hatemath1991: 我原本想說是不是我演算法理解錯誤,但是回去重看 09/28 00:01
hatemath1991: 林軒田老師的影片確定應該不會因為資料不同 09/28 00:01
hatemath1991: 產生不同樹才對所以才會慘生疑問 09/28 00:02
hatemath1991: *產 09/28 00:02
hatemath1991: 所以現在才會疑惑,為什麼兩顆樹的結構有差異 09/28 00:04
KKbiger: 為什麼會覺得train data和test data建出來的數結構會完全 09/28 10:03
KKbiger: 一樣 除非你的train data建出來的model會百分之百可以預 09/28 10:03
KKbiger: 測test data 才有可能兩個一樣吧 09/28 10:03
owem0410: 抱歉我model才建一次不是?同model解構不就要一樣? 09/28 11:56
KKbiger: 用train data抽了一棵樹 又用test data 抽出另一棵樹 09/28 14:37
KKbiger: 所以抽出兩顆不一樣的樹 09/28 14:37
APM99: 你這樣做就沒有 訓練集跟測試集的意義了 09/28 16:45
APM99: 只是單純的畫了兩棵樹 09/28 16:46
clansoda: 這邊也看的到APM99?? 09/28 16:58