作者disney82231 (小刀會序曲)
看板Python
標題[問題] pandas中conact合併df讀取變慢
時間Tue Apr 9 20:21:15 2019
大家好,我利用pd裡面conact的函數
將兩個df合併,合併完後想要在變數環境打開來看,但卻出奇的卡頓
合併為的shape為(4400,83),應該不是什麼大資料
因為我讀取(22000,158)的資料打開都很順
想請問大家有遇到這種情況嗎?
以下是我的程式碼,我有先將變數one-hot-coding,然後再進行合併,猜測可能是這一步
出問題
onehot_coding=pd.get_dummies(df[['A',"B","C",'D','E','F','G']],
prefix=('A',"B","C",'D','E','F','G'))
df1_dummy=df1.drop(['A',"B","C",'D','E','F','G'],axis=1)
df1_dummy=pd.concat([df1_dummy,onehot_coding],axis=1)
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.194.162
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1554812478.A.4BB.html
推 karta0910489: 先把兩個都轉成list 最後在把合併後的list轉成dataf 04/12 12:25
→ karta0910489: rame 04/12 12:25
→ karta0910489: concat跟append的效率都很差 04/12 12:26