作者kyo0010 (~KYO~)
看板C_Sharp
標題[問題] 抓網頁的幾個小問題
時間Tue Nov 25 21:47:06 2014
WebClient wc = new WebClient();
wc.Encoding = Encoding.UTF8;
string result = wc.DownloadString(htmlStr);
textBox1.Text = result;
很簡單的幾句而已 想把網頁的資料抓下來
成功把HTML抓下來了 想解析的時候發現抓下來的HTML有些DIV 裡的TR 跟 TD 都不見了
只看的到
<div id="m"><div id="table01">
(消失的TR跟TD)
</div> <br></div>
可是要的值都在消失的TD裡面
想了整天不知道怎麼解....
想求大大們提點一下小弟
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.11.132
※ 文章網址: http://www.ptt.cc/bbs/C_Sharp/M.1416923228.A.655.html
※ 編輯: kyo0010 (39.15.11.132), 11/25/2014 21:47:47
推 Peruheru: 你要說的是table吧?div底下怎麼會直接放tr和td? 11/26 08:32
→ Peruheru: 另外回回歸問題,我猜那是因為那些資料是js產生的 11/26 08:32
→ Peruheru: 你抓的資料大概是網頁剛產生的狀態,所以沒有動態內容 11/26 08:33
推 Peruheru: 我是不太清楚純靠c#自己刻要怎麼做... 11/26 08:37
→ Peruheru: 我的話只會想到靠其他東西來完成,如phantomjs之類的 11/26 08:38
推 a926: 你可能要在找一下,我猜你要的內容是Ajax做出來的 11/26 10:09
→ a926: 找他call的回傳資料的網址 11/26 10:10
推 Litfal: 開瀏覽器監視一下HTTP活動,應該蠻容易找到問題點的 11/28 15:50