作者fantasywater (菸酒生)
看板Programming
標題[問題] 如何抓取新聞?
時間Wed Oct 1 20:04:28 2008
請問各位一下
如果今天我要抓新聞 是要連到哪個地方抓呢@@?
以下這是google news的網址:
http://news.google.com.tw/nwshp?ned=tw
是直接連到這個url抓 還是他有提供特定的SERVER或是服務?
我的目的是要每天某個時段固定從google news抓取當天全部的新聞內容
~~~~
然後對這些新聞做處理 所以要先知道連到哪個服務或是主機
懇請解答 先說聲感謝~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.57.7
→ MOONRAKER:parse整個新聞網頁太煩 走RSS卡實在 59.115.210.205 10/01 22:29
推 liangjr:網址後面加&output=rss就會抓到rss feed 76.173.13.240 10/02 15:07
→ liangjr:再用個xml parser或regexp就可以找到網址 76.173.13.240 10/02 15:08