→ terrytai:已經懂得DOM的話......小弟還沒學過這個 ^^" 02/19 17:07
如果處理的都是網頁原始碼的文字檔
除了regex 還有另一種方法 就是在javascript常用的document object model(DOM)
微軟的webbrowser類別有把網頁轉成DOM物件的功能 可惜要寫程式不是很方便
我自己試 它好像會強迫一定要顯示出完整網頁 也就是還會下載一些網頁圖片
好消息是網路上有人自己寫了一個library
http://www.codeproject.com/dotnet/apmilhtml.asp
這個library可以直接把網頁原始碼轉換成DOM物件
已經懂得DOM的話 用這個寫程式抓那些字串就很方便
不然的話 個人感覺regex會比較簡單
※ 引述《terrytai (Terry)》之銘言:
: 如果要從一個html檔案中找出特定的字串
: 整個原始碼抓出來的字串設程string tempCode
: 已經知道我想要的字串前面一定有>
: 後面一定有</a>
: 如何把html檔案中每個符合這個條件的字串
: 都抓出來另存成新的字串?
: 那麼我是不是就先設了string StartString = ">";
: string EndString = "</a>";
: 然後呢?
: 怎麼去找出介於StartString跟EndString中間的每個字串?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.104.83.234