看板 R_Language 關於我們 聯絡資訊
library(COUNT) data(rwm5yr) medical<-rwm5yr https://imgur.com/xLr3I5j 我的目的是像這樣 同個id是同個人 我想要把資料整理成 去計算同個人的 總共 的看病次數 其他的column 就用 同個id最後的 資訊 最後要整理成 id docvis age 1 1 56 2 4 48 3 13 62 請問有套件可以做到這件事情嗎 還是怎麼寫這個迴圈呢 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.237.189 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1528518253.A.295.html
locka: medical %>% group_by(id) %>% summarize(docvis=n(), age= 06/09 12:51
locka: max(age)) 06/09 12:51
locka: dplyr group_by() +pipe 應該是最直覺好讀的方法? 06/09 12:52
locka: 更正 docvis=n () 應該為docvis=sum(docvis) 06/09 12:54
ntpuisbest: https://imgur.com/pMj4jY3 06/09 13:02
ntpuisbest: 請問其他變數該怎麼處理有沒有辦法指定 06/09 13:03
就是可不可以讓medical的[,2:12]都是類似age=max的結果 另外可以讓hhninc 取平均數嗎 謝謝大大 ※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:05:48
piggood: summarise_all(funs(last)) 06/09 13:07
piggood: 可以保留唯一 ID 所有欄的最後一筆資料 06/09 13:08
piggood: 平均值就是用 mean(hhninc) 06/09 13:11
piggood: 不過 summarise 跟 summarise_all 沒辦法一起使用 06/09 13:12
那這樣看起來我還是必須要 慢慢打了 因為我的docvis一定要加總才行 ※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:16:39
locka: 感謝piggood大大分享,原來summarise_all是這樣用…以前一 06/09 13:32
locka: 直沒搞懂XD 06/09 13:32
locka: 原po可以分別用summarise跟summarise_all做完後再合併…… 06/09 13:37
locka: 其他只好等版上大神回應了 06/09 13:37