看板 CodeJob 關於我們 聯絡資訊
我有寫過類似的東西 也是把網頁的資料抓下來分析,塞DB 我是使用vb.net。分析的部份是用正則表示式來達成。 正則表示式讓你事半功倍。 ※ 引述《yangfan (小羊)》之銘言: : ※ 引述《tristone (tristone)》之銘言: : : 在詳細一點 我想要能夠分析出 這兩個網頁針對同一個新聞的反應時間 : : 所以不能手動reload 我希望此軟體可以自動reload 並且擷取頭條新聞入data base : : 有人可以幫忙嗎? : VB.NET JAVA C# 都可以辦到 : 資料庫看是用 ACCESS 或是 MYSQL 都行 : 流程是先將網頁的原始碼抓回來 : 再來濾掉HTML碼 : 拆出新聞的位置 : 記下抓取時間 : 塞資料庫 : 收工 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.223.249.73
Blueshiva:是正規表示式吧... 09/18 12:40
menjar:Crawler + Parser + analysis 09/18 12:56
jokkson:正則、正規都有人用。原文是Regular Expression 09/18 14:50