作者nathan7812 (nathan)
看板Python
標題[問題] pandas resample 遺失資料
時間Thu Jun 7 22:03:50 2018
請問各位前輩
我在做resample的時候form daily to weekly
daily 的資料裡並沒有NaN
但是轉換成weekly後就多了21row的NaN
爬了很多文都找不到原因
請問大家這是什麼原因呢?
Input:
df_ohlc = df.resample('W').agg({'Open': 'first',
'High': 'max',
'Low': 'min',
'Close': 'last'})
print('count df_ohlc weekly null value:'+str(df_ohlc.isnull().sum()))
Output:
count df_ohlc weekly null value:Open 21
High 21
Low 21
Close 21
dtype: int64
Open High Low Close
Date
2014-12-21 NaN NaN NaN NaN
2015-01-04 NaN NaN NaN NaN
2015-01-18 NaN NaN NaN NaN
2015-01-25 NaN NaN NaN NaN
2015-02-22 NaN NaN NaN NaN
2015-03-01 NaN NaN NaN NaN
2015-04-26 NaN NaN NaN NaN
2015-05-03 NaN NaN NaN NaN
2015-05-10 NaN NaN NaN NaN
2015-08-02 NaN NaN NaN NaN
2015-08-09 NaN NaN NaN NaN
2015-08-23 NaN NaN NaN NaN
2015-11-29 NaN NaN NaN NaN
2015-12-20 NaN NaN NaN NaN
2016-02-14 NaN NaN NaN NaN
2016-04-10 NaN NaN NaN NaN
2016-04-24 NaN NaN NaN NaN
2016-06-12 NaN NaN NaN NaN
2016-07-17 NaN NaN NaN NaN
2016-07-24 NaN NaN NaN NaN
2016-07-31 NaN NaN NaN NaN
附上2014-11-26~2018-06-06 0050.TW.csv檔
https://tinyurl.com/ybffoxlt
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.148.5
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1528380236.A.D3D.html
推 kiloxx: 有幾周沒開盤阿!如新年連假之類的 06/07 22:46
※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 11:50:55
※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 11:52:37
※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 12:01:53
→ nathan7812: K大提到的問題我回去檢視後,好像不僅止於放假的問題? 06/08 12:03
推 bazoo: 你的原始資料缺的很嚴重喔,很多天都沒資料 06/08 13:24
→ nathan7812: 謝謝B大提醒,原檔真的缺的很嚴重,冏rz 06/08 13:29
→ nathan7812: 結論上來說明一下,yahoo finance的歷史資料真的缺很 06/09 01:05
→ nathan7812: 大,在找不到其他api之前,只能自己爬了。 06/09 01:05