pandas讀檔的問題

作者iphone2003 (307)

看板Python

標題pandas讀檔的問題

時間Mon May 21 14:21:55 2018

大家好我現場有大概2000份檔案，每個都要用pandas去讀可是有個問題是這些檔案的columns數量可能不太一樣比方說有的檔案有8個columns，但有的卻有10個我現在希望每個檔案的column名稱都以那10個columns的為主而如果當下讀的檔案是屬於8個columns的那種，那多出來的那兩個columns裡面的資料就都用NaN呈現即可直接設df.columns = [我希望的那10個columns] 這樣顯然不行有想到讀檔時就用names參數設定，不過手邊沒有電腦還沒試過這樣可不可以請問這樣的話要怎麼做呢？謝謝！ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.204.171 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1526883717.A.BCC.html ※ 編輯: iphone2003 (140.115.204.171), 05/21/2018 14:24:36

推 eri820503: pd.concat([df1,df2]) df1是舊的 df2是要加入的 05/21 14:53

→ iphone2003: 研究了一下似乎真的只能先建好df後再併了...謝謝！ 05/22 20:19

推 clsmbstu: 這2000份檔案是想存成2000個df還是一個大df啊？感覺做法 05/24 18:54

→ clsmbstu: 會不同 @@ 05/24 18:54