作者SmallBeeWayn (喵喵叫的蜜蜂貓)
看板Visual_Basic
標題[.NET] 寫網頁解析軟體
時間Mon Nov 28 03:04:47 2011
請輸入專案類型(網站專案或者應用程式專案): Visual Basic 2010
目前我是用PHP(自建Server),使用phpQuery套件,配合工作排程
來達到每日定時爬資料=>丟到MySQL的工作
但是這樣麻煩的是不容易管理...
而且要爬的網頁很多,(最終版本3000頁/天,我不想給Server BAN掉所以有加延遲)
所以想寫成系統服務
最複雜的方式需要
一套VB2010可用的爬網頁套件(不想自己寫)
以及VB2010連結MySQL的工具
MySQL這部分不難處理有現成的工具
但我一時之間找不到網頁解析的工具? 請問有現成的嗎?
次一點的方式就是寫程式去呼叫寫好的解析工具(by PHP)
這樣的話就是用網頁元件...請問有推薦的嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.116.180.163
※ 編輯: SmallBeeWayn 來自: 122.116.180.163 (11/28 03:08)
→ MOONRAKER:利用SGMLReader轉換成XMLDocument,再用XMLReader讀取 11/28 04:15
→ MOONRAKER:不然也有人用.NET XMLReader直接用 11/28 04:15
推 Marty:用第一個解析的時候 要多注意tbody跟ttable的問題 11/28 08:19
→ MOONRAKER:哈,原來有這一層,其實我沒真的用過 11/28 15:16
推 Marty:或許應該算是FireBug & Chorme的問題..XPath會多一層出來 11/29 09:02
→ Marty:我也是最近剛好用到才發現的..XD 11/29 09:03