精華區beta R_Language 關於我們 聯絡資訊
[關鍵字]:mlr、machine learning [出處]:https://mlr-org.github.io/mlr-tutorial/release/html/ [重點摘要]:e1071、randomForest、caret這些知名的package來回調用 重要的machine learning function嗎? 相信一定會有覺得很煩,每個 function怎麼要求的都不同,有的input要matrix有的要全都是數字,都 沒有一個整合的平台可以使用嗎? 我這不就來了嗎。 mlr package是一個整合R上泛用常見的machine learning package的平台 可以讓你在一行之內的改變就可以access to大部分的機器學習演算法 [分享內容]: ## 首先你要先告訴mlr你現在的training data是誰,還有你想predict的 ## column name,這篇文章我會以iris來作範例,假如是regression用regr代替 ## classification則用classif,在iris是classification所以是classif tsk <- makeClassifTask(data = iris , target = "Species") ## 這邊有一個argument叫ID,再後來是有其他用途的,但這邊我不設的話 ## 他預設就是你的dataframe的名稱,Species是我們要預測的colname ## 接著我們可以開始訓練我們要的model了 mod <- train("classif.randomForest",task = iris) ## 這邊是最簡易的做法,使用train function給予他你learner的名稱與 ## 上面我們賦予的task就能開始訓練,mlr接受直接使用""包含你的learning ## method,像是最簡單的線性回歸就叫做regr.lm,但是這種寫法你是使用 ## default的參數,你才可以這樣做,若是你想要改變參數的話 lrn <- makelearner(...) ## makelearner function後面還有許多參數可以調整,可以自行參酌manual ## 最後到了predict的階段 output <- predict(mod,newdata = iris) final <- output$data ## 這樣就可以得到最後的訓練結果了,在makelearner那部分可以修改predict type ## 將他設成prob就能得到機率結果囉,這邊是最最簡單的使用方法,基本上machine ## learning裡面不論是feature selection、missing value imputation、還有 ## parameter tuning等等等功能全部都包含在這一個package裡面,希望能幫助到 ## 想要使用R作為機器學習平台的使用者。需要更詳細的tutorial請參照來源, ## 寫的跟rstudio裡面的文章一樣的仔細,一步一步帶你做。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.228.105 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1480241438.A.D44.html