作者nesiron (Nes)
看板Python
標題[問題] 用pandas計算推文的速度
時間Tue Sep 3 01:50:16 2019
大家好
我想用PTT推文的時間資料,計算文章被推爆或噓爆的時間
以下是我一部分的資料:
文章ID 推文時間
1R9wmgLL → alfonsosoria 蓋 2019-06-18 20:57
1R9wmgLL → alfonsosoria 幹 2019-06-18 20:57
1R9wmgLL → meowchen 謝三樓 2019-06-18 20:57
1R9wmgLL → hitsukix 新聞很故意 2019-06-18 20:58
1R9wmgLL 推 borissun 新新相連比較好記 2019-06-18 20:58
1R9wmgLL 推 lovekangin 明眼人都知道母雞是誰 呵呵 2019-06-18 20:58
1R9wmgLL 推 Workforme 其他幾個沒連到是....不會做事? 2019-06-18 20:58
1R9wmgLL → ga652206 可憐 2019-06-18 20:58
1R9wmgLL 噓 minimax76715 綠,台灣精神,笑話連線。 2019-06-19 08:04
1RAtj_Ns → LAKobeBryant 新竹人出來說 2019-06-21 18:19
1RAtj_Ns 推 kid33 國民黨不派實力堅強的 2019-06-21 18:19
1RAtj_Ns 噓 modachen 噁不噁心 2019-06-21 18:19
1RAtj_Ns 推 venomsoul 光復路來一下謝謝 2019-06-21 18:20
我想groupby文章ID,然後在推文時間後添加一欄為淨推數(=推-噓)
這樣在淨推數為100時,就可以知道被推爆的時間和速度
下面是我的程式碼:
import pandas as pd
#讀取資料來源
csvfile = pd.read_csv("推文.csv")
group = csvfile.groupby("文章ID")
csvfile["推文時間"] = pd.to_datetime(csvfile["推文時間"])
到這裡就卡住不知道怎麼寫了QQ
請板友提點一下接下來該怎麼寫
感謝
--
Sent from my Windows
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.67.58 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1567446618.A.B80.html
※ 編輯: nesiron (220.141.67.58 臺灣), 09/03/2019 01:55:57
→ djshen: 式子列出來就會寫了吧 09/03 02:16
推 karco: 紀錄發文時間跟推文時間 09/03 03:23
→ karco: 不就能得知推爆速度了嗎? 09/03 03:23
→ karco: 搭配time應該可以算 09/03 03:23
推 gmoz: 先用頭腦去想 再用程式碼去實現 09/03 10:32
→ gmoz: 依時序往下讀 同文章噓-1 推+1 看什麼時候達到就好啦 09/03 10:32
→ nesiron: 好的,謝謝各位,比較有頭緒了 09/03 10:41
→ CodingMan: 加油 09/03 13:01
→ Kazimir: df.rolling().sum() ? 09/04 20:06