看板 Python 關於我們 聯絡資訊
再度上版請教 我有一些htm檔 我要寫他的parser 之前已經寫過一批 大致完成 最近這一批 就很奇怪 我在htm檔右鍵點編輯 htm檔看起來很亂 雖然還不至於完全亂碼 就是出現不少黑色長方型字元那樣 用NotePad++開 就很正常 重要的是 當我要寫parser的時候 我先將原始檔分成一行一行 (list) 再找有哪個項目出現特定文字 for i in li: if "地區" in i: ...... 結果是通通找不到 這個"地區"關鍵字就算用編輯打開(有點亂那個) 也還看的到 後來我全文搜 當然也搜不到 "地區" 這個關鍵字 這到底是甚麼問題呢@@ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.22.18.78
superGA:請檢查編碼 html 跟你的 code 10/14 02:50
buganini:CRLF和CR 10/14 16:48
buganini:Notepad++轉成Windows格式應該就可以了 10/14 16:49
wil771126:問題在utf-8 找到了 謝謝大家^^ 10/14 17:23
wil771126:隨後加進資料庫 又亂碼了 該怎麼辦ˊˋ 10/16 02:20