作者tumc (HIHIHI)
看板Perl
標題Re: [問題]抓取 utf8網頁
時間Wed Nov 28 20:00:37 2007
※ 引述《LiloHuang (相見不如懷念)》之銘言:
: ※ 引述《tumc (HIHIHI)》之銘言:
: : 請問一下,
: : 如何才能把抓下來的utf8網頁,
: : 轉變成big5的格式,
: : 直接用utf8存成文字檔都是亂碼
: #!/usr/bin/perl
: use Encode qw/encode decode/;
: use LWP::Simple;
: my $html = get 'http://www.kkbox.com.tw/';
: print encode("Big5", decode("utf-8", $html));
我用下面這段抓下來也是亂碼,是用 activestate版本的perl 5.8.8
以前記得用相同電腦,用不同版本的perl,不會有這問題
但重安裝xp後,重灌perl 5.8.8就不行
誰能解答為什麼會這樣
use Encode qw/encode decode/;
use LWP::Simple;
open(CK, ">check.txt");
my $html = get '
http://www.kkbox.com.tw/';
print CK encode("Big5", decode("utf-8", $html));
close (CK);
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.124.14.99
推 LiloHuang:非常正常...也沒有亂碼@@ 11/28 20:04
推 imce:我覺得拉,亂碼會不會是因為charset=utf-8這行造成的 11/29 08:59
→ imce:如果把存下來的txt改htm打開後,就會變亂碼 11/29 09:00