作者a83912a (Richie)
看板R_Language
標題[問題] 等深分箱法
時間Sun Dec 3 12:15:49 2017
最近老師上課有提到分箱法
有等寬、等深分箱法
他是要取 CSV 檔的欄位去算
等寬分箱法已經知道怎麼使用
就是先讓數值排序 接著算出最大最小值
然後在分成要的等分 就可以用 cut 分群出來
但是等深卻一直用不出來
等深是用資料的數量
但是用 cut , split 都沒有辦法
最後還是用迴圈去寫
但是感覺這就不是真正的方法
想請問有高手能教教剛入門的菜鳥嗎
謝謝各位
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.230.21
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1512274551.A.EC9.html
推 sw52099: 查查看 cross validation ,有看到類似的東西 12/03 13:09
推 x88776544pc: 假設分 K 箱 12/03 22:28
→ x88776544pc: breaks = unique(quartile(x,probs=seq(0,1,length=K 12/03 22:30
→ x88776544pc: +1))) 12/03 22:30
→ x88776544pc: new_x=cut(x,breaks,include.lowest=T,right=F) 12/03 22:31