Re: [問題] pandas 問題

作者lance5487 ( )

看板Python

標題Re: [問題] pandas 問題

時間Mon Feb 5 22:31:58 2018

不好意思，想再問另外一個問題 df= UserID time A 16:01 A 16:03 A 16:04 A 16:07 A 16:08 B 17:10 B 17:11 想計算每個USER最近值相剪的數列也就是 A 2=16:03-16:01 A 1=16:04-16:03 A 3=16:07-16:04 B 1=17:11-17:10 ※ 引述《lance5487 ( )》之銘言： : 不好意思，小弟是pandas新手，想請問pandas的問題，請各位大大幫幫小弟忙QQ : 假設今天有一個df : df= UserID time : A 16:01 : A 16:03 : A 16:04 : A 16:07 : A 16:08 : B 17:10 : B 17:11 : 想統計根據groupby UserID後以 X 分鐘時間內統計的平均,眾數,最大值 : 假設以五分鐘為例 : A : 16:01 5分鐘後為 16:06 => 共 3 筆 (16:01,16:03,16:04) : 16:03 5分鐘後為 16:08 => 共 4 筆 (16:03,16:04,16:07,16:08) : 16:04 5分鐘後為 16:09 => 共 3 筆 (16:04,16:07,16:08) : 16:07 5分鐘後為 16:12 => 共 2 筆 (16:07,16:08) : 16:08 5分鐘後為 16:13 => 共 1 筆 (16:08) : 平均:(1+2+3+3+4)/5=3.6 : 最大值:4筆 : 眾數:3筆 : 最後整理成 : USERID 平均眾數最大值 : A 3.6 3 4 : B 1.5 1或2(1.5是最好) 2 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.126.136 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517841120.A.7D5.html

推 goldflower: https://i.imgur.com/DQ23uCF.png 這樣? 02/06 05:41

好像不行因為這樣好像會計算到不同user，想求的只有同一個user底下的差值，因為user蠻多的QQ ※ 編輯: lance5487 (220.129.59.40), 02/06/2018 06:07:47

→ lance5487: 查到了好像用groupby跟diff就可以了 02/06 06:43

→ lance5487: 原本想說關鍵字不好下囧 02/06 06:45

推 goldflower: 喔喔沒看到要用user分 02/06 10:11