作者piggood (成為有品味的男人)
看板R_Language
標題Re: [問題]用迴圈整理同個ID的看病次數
時間Sat Jun 9 17:54:13 2018
※ 引述《ntpuisbest (阿龍)》之銘言:
: library(COUNT)
: data(rwm5yr)
: medical<-rwm5yr
: https://imgur.com/xLr3I5j
: 我的目的是像這樣
: 同個id是同個人
: 我想要把資料整理成
: 去計算同個人的 總共 的看病次數
: 其他的column 就用 同個id最後的 資訊
: 最後要整理成
: id docvis age
: 1 1 56
: 2 4 48
: 3 13 62
: 請問有套件可以做到這件事情嗎
: 還是怎麼寫這個迴圈呢
目前想到的方式
但也不是很簡潔
不過還能用
# 先建立一個 medical1 ,除了 docvis 和 hhninc 之外,都取最後一筆觀察值的資料
medical1 <- medical %>%
group_by(id) %>%
summarise_at(vars(-docvis,-hhninc), last)
# 再建 medical2 專門處理 docvis 跟 hhninc 的各別需求
medical2 <- medical %>%
group_by(id) %>%
summarise(sum(docvis), mean(hhninc))
# 合併在一起
medical3 <- data.frame(medical2,medical1)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.48.230
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1528538057.A.4F4.html
推 locka: 可以請問一下p大 summarise_all() 跟 summarise_at() 的差 06/09 20:44
→ locka: 別嗎? 06/09 20:44
→ piggood: summarise_at 可以指定哪些欄位要執行後面的 function 06/10 00:33
→ piggood: all 的話,就是全部欄位都執行。這個例子用 all 也可以 06/10 00:34
→ piggood: 只是會多出一些用不到的欄位 06/10 00:35
推 ntpuisbest: 非常感謝大大 06/10 21:57