作者travellu (旅行)
看板Perl
標題[問題] 抓取網頁問題
時間Sun Apr 6 16:17:56 2008
欲抓取網頁
http://www.dmoz.org/
抓網頁的副函式程式碼如下:
sub grasp_searchresult() {
my ( $query ) = @_;
my $browser = new LWP::UserAgent;
$browser->agent( 'Mozilla/4.76 [en] (WinXp; U)' );
my $request = q();
$request = new HTTP::Request( "Get",
"
http://www.dmoz.org/" );
my $html = $browser->request($request);
return $html->content;
}
抓出來的東西是空的
抓其它網頁例如yahoo首頁則是沒問題
不曉得是不是這個網頁有什麼特殊的限制?
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.245.222
推 mosquito520:你的agent看起來很怪= =... 04/07 03:50
→ travellu:一直以來都這樣寫,都OK!直到碰到這個網站才有問題 04/07 11:51
→ travellu:不曉得一樓大大有什麼好的建議? 04/07 11:54