精華區beta R_Language 關於我們 聯絡資訊
最近老師上課有提到分箱法 有等寬、等深分箱法 他是要取 CSV 檔的欄位去算 等寬分箱法已經知道怎麼使用 就是先讓數值排序 接著算出最大最小值 然後在分成要的等分 就可以用 cut 分群出來 但是等深卻一直用不出來 等深是用資料的數量 但是用 cut , split 都沒有辦法 最後還是用迴圈去寫 但是感覺這就不是真正的方法 想請問有高手能教教剛入門的菜鳥嗎 謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.230.21 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1512274551.A.EC9.html
sw52099: 查查看 cross validation ,有看到類似的東西 12/03 13:09
x88776544pc: 假設分 K 箱 12/03 22:28
x88776544pc: breaks = unique(quartile(x,probs=seq(0,1,length=K 12/03 22:30
x88776544pc: +1))) 12/03 22:30
x88776544pc: new_x=cut(x,breaks,include.lowest=T,right=F) 12/03 22:31