作者wil771126 (雨的印記)
看板Python
標題[問題] 這是編碼的問題嗎??
時間Wed Oct 14 02:37:10 2009
再度上版請教
我有一些htm檔 我要寫他的parser
之前已經寫過一批 大致完成
最近這一批 就很奇怪
我在htm檔右鍵點編輯 htm檔看起來很亂 雖然還不至於完全亂碼
就是出現不少黑色長方型字元那樣
用NotePad++開 就很正常
重要的是 當我要寫parser的時候
我先將原始檔分成一行一行 (list)
再找有哪個項目出現特定文字
for i in li:
if "地區" in i:
......
結果是通通找不到
這個"地區"關鍵字就算用編輯打開(有點亂那個) 也還看的到
後來我全文搜 當然也搜不到 "地區" 這個關鍵字
這到底是甚麼問題呢@@
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.22.18.78
推 superGA:請檢查編碼 html 跟你的 code 10/14 02:50
推 buganini:CRLF和CR 10/14 16:48
→ buganini:Notepad++轉成Windows格式應該就可以了 10/14 16:49
→ wil771126:問題在utf-8 找到了 謝謝大家^^ 10/14 17:23
→ wil771126:隨後加進資料庫 又亂碼了 該怎麼辦ˊˋ 10/16 02:20