作者ctr1 (【積π】)
看板Python
標題[問題] pd.read_csv ParserError
時間Wed Oct 23 22:03:19 2019
df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL')
文本分隔是以' '或大於一個空白切分
沒有header
但是當切到內容含有 // 時會報錯
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw
7
有查過使用error_bad_lines=False屬性 但想保留資料
想問問看是否有不需要replace整份文本而可以正常read_csv檔
因為csv檔又大又多,若是一行一行replace很耗時費力
感謝大大
-------------文本內容-------------
Jan 2 07:50:41 clftp1 ftpd[14459]: NOOP
Jan 2 07:50:41 clftp1 ftpd[14459]: CWD //MG11T36.1
Jan 2 07:50:41 clftp1 ftpd[14459]: PORT
Jan 2 07:50:41 clftp1 ftpd[14459]: LIST
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.178.188 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1571839401.A.F84.html
※ 編輯: ctr1 (118.160.178.188 臺灣), 10/23/2019 22:16:14
推 TitanEric: 這應該是因為你有多//所以導致attributes不一致 看你 10/23 22:36
→ TitanEric: 要先做前處理移掉還是你指定要7個attributes 空值填N 10/23 22:37
→ TitanEric: aN 10/23 22:37
→ ctr1: 沒辦法read_csv->dataframe,是否只能一行一行的前處理呢 10/23 22:38
推 TitanEric: 可以一行處理 就用python讀檔處理後再存新檔 10/24 10:35
→ ctr1: 謝謝你~ 10/24 14:50