作者ROCKIT (ROLL)
看板PHP
標題[請益] 有沒有人有使用Crawler的經驗壓
時間Wed Sep 1 21:11:52 2010
由於研究需要從網站上抓資料下來
試了一些現有的套件
網站的原始碼是抓下來了
但是中文的地方全變亂碼了...
可是我要分析的偏偏就是這些中文的文字...
請問有人有相關的經驗嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.96.163
推 flamerecca:有嘗試將抓下來的資料用另一個編碼打開嗎? 09/01 21:25
→ ROCKIT:我如果用瀏覽器開啟,是可以正常顯示,但是我要是直接用 09/02 13:43
→ ROCKIT:其他IDE開啟,就都是亂碼,因為我還要將這些文字INSERT 09/02 13:44
→ ROCKIT:進資料庫....要做文字的比較分析,這樣應該會有問題... 09/02 13:44