看板 Python 關於我們 聯絡資訊
df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL') 文本分隔是以' '或大於一個空白切分 沒有header 但是當切到內容含有 // 時會報錯 ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw 7 有查過使用error_bad_lines=False屬性 但想保留資料 想問問看是否有不需要replace整份文本而可以正常read_csv檔 因為csv檔又大又多,若是一行一行replace很耗時費力 感謝大大 -------------文本內容------------- Jan 2 07:50:41 clftp1 ftpd[14459]: NOOP Jan 2 07:50:41 clftp1 ftpd[14459]: CWD //MG11T36.1 Jan 2 07:50:41 clftp1 ftpd[14459]: PORT Jan 2 07:50:41 clftp1 ftpd[14459]: LIST -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.178.188 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1571839401.A.F84.html ※ 編輯: ctr1 (118.160.178.188 臺灣), 10/23/2019 22:16:14
TitanEric: 這應該是因為你有多//所以導致attributes不一致 看你 10/23 22:36
TitanEric: 要先做前處理移掉還是你指定要7個attributes 空值填N 10/23 22:37
TitanEric: aN 10/23 22:37
ctr1: 沒辦法read_csv->dataframe,是否只能一行一行的前處理呢 10/23 22:38
TitanEric: 可以一行處理 就用python讀檔處理後再存新檔 10/24 10:35
TitanEric: https://bit.ly/2pcmswm 剛做的 可以參考一下 10/24 11:14
ctr1: 謝謝你~ 10/24 14:50