[問題] 完全新手問題 有關csv產出

作者meichiang (美江)

看板Python

標題[問題] 完全新手問題有關csv產出

時間Sat Sep 22 01:18:28 2018

手邊有一大筆資料 1千多萬的資料第一欄位為商品代碼之後欄位為這商品的其他資料總共有一千多萬筆資料要將一個大的 csv檔根據第一欄的商品代碼根據商品代碼另存為csv檔由於沒寫過程式爬文慢慢寫出以下東西但感覺錯了用小筆資料跑明顯的跑錯只開了根據商品別開csv 但csv內沒讀取到資料 https://i.imgur.com/Tl2oDh9.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.133.180 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1537550310.A.123.html

→ shadowfu: 可以改用pandas的dataframe來做可能會好做一點09/22 01:27

→ jackwang01: 你的y是有csv副檔名的，if y in fcolumn1可能找不到東09/22 01:47

→ jackwang01: 西？09/22 01:47

→ meichiang: 有好的解決方法嗎？09/22 02:15

→ meichiang: 如果一次跑太多筆資料要怎麼防呆09/22 02:15

→ jackwang01: 把y改成column1應該就行了？不知道你想做的是不是這09/22 02:19

→ jackwang01: 樣09/22 02:19

是的小資料可以跑了但原始資料跑不了不知道如何解決就是讀完一筆資料後跳下一筆 ※ 編輯: meichiang (1.161.133.180), 09/22/2018 11:15:23

→ DChun: 可以試看看pandas09/22 11:25

→ fgghhg: 跑不了是跑不完嗎？還是跑完沒結果？這不一樣09/22 12:27

→ fgghhg: 這寫法是全部都讀到memory做，一千多萬筆是有點多，有可09/22 12:29

→ fgghhg: 能吃不下，還要看一筆有多大09/22 12:29

第一筆資料都跑不完直接index out of rang ※ 編輯: meichiang (1.161.133.180), 09/22/2018 16:14:21

→ acer1832a: 你要不要檢查一下CASHVALUE.csv這個檔案，看有沒有某一 09/26 09:43

→ acer1832a: 行是空白沒資料的。因為for in應該是不會有index out 09/26 09:44

→ acer1832a: of range，比較有可能是在fline.split(',')[1]這裡出錯 09/26 09:46

→ virginbear: 不做巢狀資料庫嗎？ 10/19 15:42