[問題] pd.read_csv ParserError

作者ctr1 (【積π】)

看板Python

標題[問題] pd.read_csv ParserError

時間Wed Oct 23 22:03:19 2019

df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL') 文本分隔是以' '或大於一個空白切分沒有header 但是當切到內容含有 // 時會報錯 ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw 7 有查過使用error_bad_lines=False屬性但想保留資料想問問看是否有不需要replace整份文本而可以正常read_csv檔因為csv檔又大又多，若是一行一行replace很耗時費力感謝大大 -------------文本內容------------- Jan 2 07:50:41 clftp1 ftpd[14459]: NOOP Jan 2 07:50:41 clftp1 ftpd[14459]: CWD //MG11T36.1 Jan 2 07:50:41 clftp1 ftpd[14459]: PORT Jan 2 07:50:41 clftp1 ftpd[14459]: LIST -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.178.188 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1571839401.A.F84.html ※ 編輯: ctr1 (118.160.178.188 臺灣), 10/23/2019 22:16:14

推 TitanEric: 這應該是因為你有多//所以導致attributes不一致看你 10/23 22:36

→ TitanEric: 要先做前處理移掉還是你指定要7個attributes 空值填N 10/23 22:37

→ TitanEric: aN 10/23 22:37

→ ctr1: 沒辦法read_csv->dataframe，是否只能一行一行的前處理呢 10/23 22:38

推 TitanEric: 可以一行處理就用python讀檔處理後再存新檔 10/24 10:35

推 TitanEric: https://bit.ly/2pcmswm 剛做的可以參考一下 10/24 11:14

→ ctr1: 謝謝你~ 10/24 14:50