看板 Visual_Basic 關於我們 聯絡資訊
請輸入專案類型(網站專案或者應用程式專案): Visual Basic 2010 目前我是用PHP(自建Server),使用phpQuery套件,配合工作排程 來達到每日定時爬資料=>丟到MySQL的工作 但是這樣麻煩的是不容易管理... 而且要爬的網頁很多,(最終版本3000頁/天,我不想給Server BAN掉所以有加延遲) 所以想寫成系統服務 最複雜的方式需要 一套VB2010可用的爬網頁套件(不想自己寫) 以及VB2010連結MySQL的工具 MySQL這部分不難處理有現成的工具 但我一時之間找不到網頁解析的工具? 請問有現成的嗎? 次一點的方式就是寫程式去呼叫寫好的解析工具(by PHP) 這樣的話就是用網頁元件...請問有推薦的嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.116.180.163 ※ 編輯: SmallBeeWayn 來自: 122.116.180.163 (11/28 03:08)
MOONRAKER:HTMLAgilityPack http://htmlagilitypack.codeplex.com/ 11/28 04:04
MOONRAKER:或 http://developer.mindtouch.com/SgmlReader 11/28 04:14
MOONRAKER:利用SGMLReader轉換成XMLDocument,再用XMLReader讀取 11/28 04:15
MOONRAKER:不然也有人用.NET XMLReader直接用 11/28 04:15
Marty:用第一個解析的時候 要多注意tbody跟ttable的問題 11/28 08:19
MOONRAKER:哈,原來有這一層,其實我沒真的用過 11/28 15:16
Marty:或許應該算是FireBug & Chorme的問題..XPath會多一層出來 11/29 09:02
Marty:我也是最近剛好用到才發現的..XD 11/29 09:03