看板 Python 關於我們 聯絡資訊
大家好 我現場有大概2000份檔案,每個都要用pandas去讀 可是有個問題是這些檔案的columns數量可能不太一樣 比方說有的檔案有8個columns,但有的卻有10個 我現在希望每個檔案的column名稱都以那10個columns的為主 而如果當下讀的檔案是屬於8個columns的那種,那多出來的那兩個columns裡面的資料就 都用NaN呈現即可 直接設df.columns = [我希望的那10個columns] 這樣顯然不行 有想到讀檔時就用names參數設定,不過手邊沒有電腦還沒試過這樣可不可以 請問這樣的話要怎麼做呢? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.204.171 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1526883717.A.BCC.html ※ 編輯: iphone2003 (140.115.204.171), 05/21/2018 14:24:36
eri820503: pd.concat([df1,df2]) df1是舊的 df2是要加入的 05/21 14:53
iphone2003: 研究了一下似乎真的只能先建好df後再併了...謝謝! 05/22 20:19
clsmbstu: 這2000份檔案是想存成2000個df還是一個大df啊?感覺做法 05/24 18:54
clsmbstu: 會不同 @@ 05/24 18:54