作者iphone2003 (307)
看板Python
標題pandas讀檔的問題
時間Mon May 21 14:21:55 2018
大家好
我現場有大概2000份檔案,每個都要用pandas去讀
可是有個問題是這些檔案的columns數量可能不太一樣
比方說有的檔案有8個columns,但有的卻有10個
我現在希望每個檔案的column名稱都以那10個columns的為主
而如果當下讀的檔案是屬於8個columns的那種,那多出來的那兩個columns裡面的資料就
都用NaN呈現即可
直接設df.columns = [我希望的那10個columns]
這樣顯然不行
有想到讀檔時就用names參數設定,不過手邊沒有電腦還沒試過這樣可不可以
請問這樣的話要怎麼做呢?
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.204.171
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1526883717.A.BCC.html
※ 編輯: iphone2003 (140.115.204.171), 05/21/2018 14:24:36
推 eri820503: pd.concat([df1,df2]) df1是舊的 df2是要加入的 05/21 14:53
→ iphone2003: 研究了一下似乎真的只能先建好df後再併了...謝謝! 05/22 20:19
推 clsmbstu: 這2000份檔案是想存成2000個df還是一個大df啊?感覺做法 05/24 18:54
→ clsmbstu: 會不同 @@ 05/24 18:54