[問題] pandas處理多個csv找指定的csv

作者harryron9 (兩個世界)

看板Python

標題[問題] pandas處理多個csv找指定的csv

時間Fri Dec 20 13:24:32 2019

假設我現在有例如 AAA001.CSV AAA002.CSV . . . AAA020.CSV 每個檔案的格式都一樣假設有一列叫成功率我想要尋找成功率最高的CSV 把那個CSV複製到其他資料夾目前想法是迴圈讀20個檔案讀出最大值與MAX比記錄檔名迴圈完後pandas讀取寫入到其他資料夾感覺繞有點多圈不知道有沒有比較好的方法 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.204.56 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1576819474.A.2C8.html

→ Hsins: 沒有，都是不可省略的步驟。你如果覺得要讀兩次檔案，可以 12/20 13:33

→ Hsins: 一次讀入再去篩，不過並不會比較好…吃記憶體而求不會快到 12/20 13:33

→ Hsins: 哪裡去… 12/20 13:33

那如果我每個CSV都是500行好像可以concat ignore index 之後直接找df.idxmax 用index來決定檔名不過concat也是要一個一個做沒比較快的樣子 ※ 編輯: harryron9 (101.9.204.56 臺灣), 12/20/2019 13:46:24

→ Hsins: 複雜度一定至少 O(n)，那個遍歷一次的過程是去不掉的。 12/20 13:49

→ Hsins: 你能做精簡的就是比如迴圈時，能不能花更少時間更少空間 12/20 13:50