作者snowfly (飄然似雪)
看板Perl
標題Re: [問題] 如何抓digg news中的comment!
時間Mon Feb 16 19:50:57 2009
http://search.cpan.org/~kwilms/Net-Digg-0.11/lib/Net/Digg.pm
自己看看有沒有你要的
※ 引述《abcg5 (nothing)》之銘言:
: 首先 我想用perl來抓digg
: 裡面的news和news的全部comments
: news我知道怎抓~
: 但是news的comments我就不知道要如何抓了
: 情況就像這個網址的例子
: http://digg.com/2008_us_elections/Digg_This_If_You_Voted_For_Obama_2
: 他只有顯示前50個comments(原始碼內也只有1-50的comments)
: 就算我手動點選"show 51-100 of 1665 discussions"
: (此時的原始碼還是只有1-50的comments)
: 問題來了~~
: 這樣子 每則news我就只能抓到前50個comments 分析上將會失真...
: 所以 像這種使用class的動態網頁~
: 改變顯示內容時 網址不跟著改變!
: (comments都在原始碼 <div class="comment">之後)
: 這種情況 perl要如何處理(這算是deep web的問題嗎??)
: 才能抓到例子中 1665個comments!?
: 請知道如何處理的高手好心教我一下! ^^
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.142.1.41
推 abcg5:謝謝 我先試試看!!^^ 02/17 12:06
→ abcg5:到現在我用CPAN還沒安裝成功過...明明都照做了!! 02/17 15:02
推 abliou:為什麼要這麼複雜?直接用ppm install net-digg不能裝嗎? 02/17 15:12
推 abcg5:忘了= =" 之前裝DBD-mysql時 那樣不能裝! 這次就忘了.. 02/18 16:53