作者joson4921 (特務)
看板R_Language
標題[問題] 列與列計算時間差,結果與預期不同
時間Sun Jan 1 07:21:35 2017
文章分類提示:
- 問題: 當你想要問問題時,請使用這個類別。
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
如標題,我想做的是列與列的時間計算(以本例來說就是找不同車次發車時間間隔)
手邊有一份端點站的發車時間表如下所示
表定6:00~8:00「每隔10~20分不等」(去/返程)對開出一班車
我想要的結果是根據每個車次的發車時間找出一個range,用來判斷實際發車時間應屬哪一
車次
先假設這個range的預期結果是前後車次發車時間的中間值(5/5分配,之後可能會用2/8分)
:
(去/返程) (表定發車時間) (車次編號) (預期結果↓)
Goback Schedule_DepartTime Bus_No. rid1 qid1 start1 end1 difference
0 06:00 1 1 0 06:00 08:00 -
0 06:20 2 2 1 06:20 06:00 20min
0 06:35 3 3 2 06:35 06:20 15min
0 06:50 4 4 3 06:50 06:35 15min
0 07:00 5 5 4 07:00 06:50 10min
0 07:10 6 6 5 07:10 07:00 10min
0 07:25 7 7 6 07:25 07:10 15min
0 07:40 8 8 7 07:40 07:25 15min
0 08:00 9 9 8 08:00 07:40 20min
1 06:00 1 10 0 ---
1 06:20 2 11 1 ---
1 06:35 3 12 2 ---
1 06:50 4 13 3 --- 因兩端點發車時間相同故
1 07:00 5 14 4 --- Goback=1時之預期結果應
1 07:10 6 15 5 --- 與Goback=0之預期結果相
同
1 07:25 7 16 6 ---
1 07:40 8 17 7 ---
1 08:00 9 18 8 ---
###先新增column "rid1" 和 "qid1",時間相減時要用
式1 BusScedule_51[, Schedule_DepartTime :=
as.POSIXct(strptime(strptime( Schedule_DepartTime, "%H:%M"))] %>%
式2 Schedule_DepartTime, "%H:%M"))] %>%
.[ , c("rid1","qid1") := list( .I, {.I - .I[1L]}), by = .(Goback)]
###用上面2式新增的 "rid1" 和 "qid1" column跑以下式子,
###但出來的答案跟預期的答案不一樣
式3 BusScedule_51[ , start1 := Schedule_DepartTime[Bus_No.] ]
式4 BusScedule_51[ , end1 := Schedule_DepartTime[-qid1] ]
式5 BusScedule_51[ , difference := start1 - end1 ]
問題:
我知道式4裡面寫 [-qid1] 會抓讓過來的時間資料通通下移,
我想利用這個特性來作時間加減,但 qid1=0 的情況要怎麼處理difference我還沒想到..
總之是拿之前寫的code改,但是出來的結果卻變成下面那樣:
(請注意"---"右邊end1那一排):
(去/返程) (表定發車時間) (車次編號) (預期結果↓)
Goback Schedule_DepartTime Bus_No. rid1 qid1 start1 end1 difference
0 06:00 1 1 0 06:00 08:00 -
0 06:20 2 2 1 06:20 06:00 20min
0 06:35 3 3 2 06:35 06:20 15min
0 06:50 4 4 3 06:50 06:35 15min
0 07:00 5 5 4 07:00 06:50 10min
0 07:10 6 6 5 07:10 07:00 10min
0 07:25 7 7 6 07:25 07:10 15min
0 07:40 8 8 7 07:40 07:25 15min
0 08:00 9 9 8 08:00 07:40 20min
1 06:00 1 10 0 --- 08:00
1 06:20 2 11 1 --- 08:00
1 06:35 3 12 2 --- 06:00
1 06:50 4 13 3 --- 06:20
1 07:00 5 14 4 --- 06:35
1 07:10 6 15 5 --- 06:50
1 07:25 7 16 6 --- 07:00
1 07:40 8 17 7 --- 07:10
1 08:00 9 18 8 --- 07:20
如上所示,「資料出現在不該出現的位置」,搞了快2天還是搞不懂到底是哪裡寫錯了
請求板上大大們伸出援手...先謝謝大家orz
[程式範例]:
[環境敘述]:
請提供 sessionInfo() 的輸出結果,
裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
讓版友更容易找出錯誤
[關鍵字]:
選擇性,也許未來有用
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.136.219
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1483226505.A.DDD.html
※ 編輯: joson4921 (140.113.136.219), 01/01/2017 07:23:41
→ cywhale: 如果只算時間差 diff:=start-shift(start),by=.(Goback)01/01 08:21
好的,待會來試試@@
※ 編輯: joson4921 (114.136.66.35), 01/01/2017 08:24:56
→ celestialgod: 建議拆成兩張表做,兩張表都用同一個函數處理 01/01 14:04
→ celestialgod: 之後再合併 01/01 14:04
→ celestialgod: 然後strptime跟as.POSIXct的performance很差 01/01 14:04
→ celestialgod: 我也會建議在前處理就做好,中間不要再轉換 01/01 14:05
→ celestialgod: 如果拆成兩張做,我覺得你的問題就可以解決了 01/01 14:05
→ celestialgod: 用split(data.table, by = "GoBack) 01/01 14:05
→ celestialgod: 然後配上 lapply(split_list, function(dt) ...) 01/01 14:06
→ celestialgod: 最後再 rbindlist變回同一張表 01/01 14:06
→ joson4921: c大可能是我用的方法不對,我查了一堆lapply的用法但都 01/02 17:57
→ joson4921: 沒講到要怎麼做時間相減..轉回dataframe的方法還在看.. 01/02 17:58
→ celestialgod: 我不是說用lapply做時間相減,我意思是你這裡 01/02 20:23
→ celestialgod: 拆成list個別處理可以比較簡單 01/02 20:23
→ celestialgod: 時間相減,我之前不是demo過了嗎? 01/02 20:24
→ celestialgod: 我還是建議就給一個虛擬日期 然後相減就好啦 01/02 20:24
→ joson4921: 喔喔!!是我誤會了..orz 這就來弄,感謝!! 01/02 20:38
→ joson4921: 死了...能不能請c大推薦用list處理資料的文...我之前都 01/02 21:16
→ joson4921: 是處理dataframe, list好像不給用 := 處理... 01/02 21:17
→ joson4921: split完之後就卡了,R不給我用 := 後面根本沒辦法寫.. 01/02 21:30
→ celestialgod: 把置底的翻轉教室玩過一遍吧 01/03 00:11
→ joson4921: 好的,謝謝c大 01/03 00:25