看板 Python 關於我們 聯絡資訊
不好意思,想再問另外一個問題 df= UserID time A 16:01 A 16:03 A 16:04 A 16:07 A 16:08 B 17:10 B 17:11 想計算每個USER最近值相剪的數列 也就是 A 2=16:03-16:01 A 1=16:04-16:03 A 3=16:07-16:04 B 1=17:11-17:10 ※ 引述《lance5487 ( )》之銘言: : 不好意思,小弟是pandas新手,想請問pandas的問題,請各位大大幫幫小弟忙QQ : 假設今天有一個df : df= UserID time : A 16:01 : A 16:03 : A 16:04 : A 16:07 : A 16:08 : B 17:10 : B 17:11 : 想統計根據groupby UserID後 以 X 分鐘時間內統計的平均,眾數,最大值 : 假設以五分鐘為例 : A : 16:01 5分鐘後為 16:06 => 共 3 筆 (16:01,16:03,16:04) : 16:03 5分鐘後為 16:08 => 共 4 筆 (16:03,16:04,16:07,16:08) : 16:04 5分鐘後為 16:09 => 共 3 筆 (16:04,16:07,16:08) : 16:07 5分鐘後為 16:12 => 共 2 筆 (16:07,16:08) : 16:08 5分鐘後為 16:13 => 共 1 筆 (16:08) : 平均:(1+2+3+3+4)/5=3.6 : 最大值:4筆 : 眾數:3筆 : 最後整理成 : USERID 平均 眾數 最大值 : A 3.6 3 4 : B 1.5 1或2(1.5是最好) 2 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.126.136 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517841120.A.7D5.html
goldflower: https://i.imgur.com/DQ23uCF.png 這樣? 02/06 05:41
好像不行 因為這樣好像會計算到不同user,想求的只有同一個user底下的差值 ,因為user蠻多的QQ ※ 編輯: lance5487 (220.129.59.40), 02/06/2018 06:07:47
lance5487: 查到了 好像用groupby跟diff就可以了 02/06 06:43
lance5487: 原本想說關鍵字不好下 囧 02/06 06:45
goldflower: 喔喔沒看到要用user分 02/06 10:11