作者studioA (understand?)
看板R_Language
標題[問題] 如何將前n小時資料另存一個欄位
時間Thu Jul 21 11:17:08 2022
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
我有一組data.table數據,格式如下, 我想新增1個欄位RH03,擺放RH值前3小時的數據,
我用dplyr 的 mutate 但出現錯誤訊息,請問要如何修正?
Data %>% mutate("RH03" =RH[-3])
Date hour RH
2022-07-01 1 71
2022-07-01 2 72
2022-07-01 3 77
2022-07-01 4 78
2022-07-01 5 83
2022-07-01 6 NA
2022-07-01 7 78
2022-07-01 8 70
2022-07-01 9 65
2022-07-01 10 60
2022-07-01 11 58
2022-07-01 12 55
2022-07-01 13 57
2022-07-01 14 58
2022-07-01 15 61
2022-07-01 16 79
2022-07-01 17 73
2022-07-01 18 66
2022-07-01 19 65
2022-07-01 20 72
2022-07-01 21 74
2022-07-01 22 74
2022-07-01 23 78
2022-07-01 24 81
[程式範例]:
[環境敘述]:
請提供 sessionInfo() 的輸出結果,
裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
讓版友更容易找出錯誤
[關鍵字]:
選擇性,也許未來有用
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.239.93 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1658373430.A.912.html
※ 編輯: studioA (27.53.239.93 臺灣), 07/21/2022 11:24:00
※ 編輯: studioA (27.53.239.93 臺灣), 07/21/2022 11:26:00
推 lycantrope: 可以用lag(RH, n=3L)來取得位移後的資料,反之用lead 07/21 11:42
推 wayturn: 若不能保證每小時都有RH、資料集有排序,建議是前兩欄轉 07/21 19:56
→ wayturn: 成時間格式>>判斷3小時是否資料>>新欄位賦予 07/21 19:56
推 Gjerry: Data[, tmp := hour - 3] 07/22 01:10
→ Gjerry: merge(Data[, -"tmp"], Data[, -"hour"], by.x = "hour", 07/22 01:13
→ Gjerry: by.y = "tmp", all = T) 07/22 01:13
→ Gjerry: 然後再清理一下表格移除不需要的NA就好了 07/22 01:14
推 fox1375: 用ifelse就可以了,不過如果不是前3小時要擺多少,0嗎? 07/22 02:30
→ fox1375: Data %>% mutate(RH03 = ifelse(hour <= 3, RH, 0)) 07/22 02:31
→ fox1375: NA就Data %>% mutate(RH03 = ifelse(hour <= 3, RH, NA)) 07/22 02:32
推 hohiyan: data.table的話 df[, RH03 := shift(RH, 3L, 0, "lag")] 07/22 03:00
→ hohiyan: 如果前3個小時不填0而是NA,就把0改成NA即可 07/22 03:00
→ studioA: 感謝解答疑惑 07/22 11:56