作者jokkson (Jason)
看板CodeJob
標題Re: [請益] 請問網頁掃描軟體開發
時間Tue Sep 18 12:35:59 2007
我有寫過類似的東西
也是把網頁的資料抓下來分析,塞DB
我是使用vb.net。分析的部份是用正則表示式來達成。
正則表示式讓你事半功倍。
※ 引述《yangfan (小羊)》之銘言:
: ※ 引述《tristone (tristone)》之銘言:
: : 在詳細一點 我想要能夠分析出 這兩個網頁針對同一個新聞的反應時間
: : 所以不能手動reload 我希望此軟體可以自動reload 並且擷取頭條新聞入data base
: : 有人可以幫忙嗎?
: VB.NET JAVA C# 都可以辦到
: 資料庫看是用 ACCESS 或是 MYSQL 都行
: 流程是先將網頁的原始碼抓回來
: 再來濾掉HTML碼
: 拆出新聞的位置
: 記下抓取時間
: 塞資料庫
: 收工
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.223.249.73
推 Blueshiva:是正規表示式吧... 09/18 12:40
推 menjar:Crawler + Parser + analysis 09/18 12:56
推 jokkson:正則、正規都有人用。原文是Regular Expression 09/18 14:50