作者jami520 (我的生命因你而發光)
看板Visual_Basic
標題[.NET] 如何解析HTML碼?
時間Sat Jan 1 23:35:13 2011
目前有擷取到網頁的原始碼,但要如何擷取我要的資訊呢?
Dim web As New System.Net.WebClient()
web.Headers.Add("Content-Type", "application/x-www-form-urlencoded")
Dim d As Byte() =
System.Text.Encoding.GetEncoding("Big5").GetBytes("syear=20100908")
Dim res As Byte() =
web.UploadData("
http://www.tai.asp", "POST", d)
MsgBox(System.Text.Encoding.GetEncoding("Big5").GetString(res))
res為擷取到的網頁原始碼
那我假設要網頁原始檔裡面<TD align=right class="12bk">8817</TD>的8817
不知道接下來還要怎樣處理呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 219.71.218.129
推 pinkykk:字串處理嗎? 01/02 00:30
→ jami520:是的~ res已經是網頁的原始碼了,但要擷取要的字串如何做? 01/02 07:49
→ jami520:正規化可以寫成~抓取<TD> </TD>的方式嗎?這樣子改為其他 01/02 08:20
→ jami520:如<span></span>的方式也可以適用,只是這要如何寫呢? 01/02 08:21
推 UniFish:先抓"<TD",然後在搜尋">"~這樣才是完整的判斷 01/02 12:27