看板 Python 關於我們 聯絡資訊
如題,想要抓的網站超連結的URL不是固定的 是用一些encoding之後有點隨機決定的網址 打開原始碼之後可看到最重要的這兩行 document.getElementById("TheImg").src = "http://img"+sid+".8comic.com/"+did+"/"+itemid+"/"+num+"/"+img+".jpg"; 我在Google chrome JavaScript console裡面 只要輸入 document.getElementById("TheImg").src 就可以看到他的值 也就知道要抓的頁面的網址 我在用python抓網站時 parse後 發現我需要得知這個值(沒有直接寫在原始碼裡) 但是不知道怎麼辦 請問有辦法嗎@@ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.108.140
autumned:我有看了urllib2 beautifulsoup之類的 12/04 22:02
autumned:但是看起來都只是幫忙parse , 這個感覺必須真的去 12/04 22:03
autumned:Query這個值? 12/04 22:03
suzuke:如果方便的話給出網站或許比較容易有解答 12/04 23:24
view-source:http://www.8comic.com/love/drawing-233.html?ch=2-9 想要的網址其實就是 document.getElementById("TheImg").src 的值 這個CASE其實可以自己抓下原始碼之後去算啦...可是假如 不知道他的值是怎麼算出來的怎麼辦@@ ※ 編輯: autumned 來自: 218.166.108.140 (12/05 00:00)
timTan:codes 這個javascript 內的變數可以拿來運用啊。 12/06 01:26