作者lance5487 ( )
看板Python
標題Re: [問題] pandas 問題
時間Mon Feb 5 22:31:58 2018
不好意思,想再問另外一個問題
df= UserID time
A 16:01
A 16:03
A 16:04
A 16:07
A 16:08
B 17:10
B 17:11
想計算每個USER最近值相剪的數列
也就是
A 2=16:03-16:01
A 1=16:04-16:03
A 3=16:07-16:04
B 1=17:11-17:10
※ 引述《lance5487 ( )》之銘言:
: 不好意思,小弟是pandas新手,想請問pandas的問題,請各位大大幫幫小弟忙QQ
: 假設今天有一個df
: df= UserID time
: A 16:01
: A 16:03
: A 16:04
: A 16:07
: A 16:08
: B 17:10
: B 17:11
: 想統計根據groupby UserID後 以 X 分鐘時間內統計的平均,眾數,最大值
: 假設以五分鐘為例
: A
: 16:01 5分鐘後為 16:06 => 共 3 筆 (16:01,16:03,16:04)
: 16:03 5分鐘後為 16:08 => 共 4 筆 (16:03,16:04,16:07,16:08)
: 16:04 5分鐘後為 16:09 => 共 3 筆 (16:04,16:07,16:08)
: 16:07 5分鐘後為 16:12 => 共 2 筆 (16:07,16:08)
: 16:08 5分鐘後為 16:13 => 共 1 筆 (16:08)
: 平均:(1+2+3+3+4)/5=3.6
: 最大值:4筆
: 眾數:3筆
: 最後整理成
: USERID 平均 眾數 最大值
: A 3.6 3 4
: B 1.5 1或2(1.5是最好) 2
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.126.136
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517841120.A.7D5.html
好像不行 因為這樣好像會計算到不同user,想求的只有同一個user底下的差值
,因為user蠻多的QQ
※ 編輯: lance5487 (220.129.59.40), 02/06/2018 06:07:47
→ lance5487: 查到了 好像用groupby跟diff就可以了 02/06 06:43
→ lance5487: 原本想說關鍵字不好下 囧 02/06 06:45
推 goldflower: 喔喔沒看到要用user分 02/06 10:11