→ ssccg:抓網頁,找到網址,抓圖 07/26 21:05
推 Y78:regexp 07/26 22:55
抱歉沒說清楚,大家好像誤會我的意思
我知道regular expression可以幫上忙
不過問題是當我想要抓
<img src="http://test.com/test.jpg">
這樣的東西就OK
可是當圖片是以上述方式呈現的時候
我就沒有辦法抓到圖片
(不是程式辨認不出來那是圖片的tag
是因為要透過php先得到圖片,所以導致程式下載下來是亂碼)
請問要怎麼辦呢?
※ 編輯: friendever (123.193.37.30), 07/26/2014 23:39:52
→ PTT007:用程式模擬瀏覽器,當它網頁載入完以後,再用regular抓圖 07/27 00:07
推 lolikung:PHP Simple HTML DOM Parser 07/27 02:22
→ lolikung:可能是 php 頁面會重新導向到圖片網址,所以抓到的其實 07/27 02:25
→ lolikung:是 header? 07/27 02:25
→ ssccg:你先看看那個圖片網址回來的response內容是什麼 07/27 03:08
→ ssccg:是直接content type就是圖,還是http 302還是別的東西 07/27 03:11
→ ssccg:server端php還什麼都不重要,你只要管回來的是什麼 07/27 03:12
推 hschao:照抓呀 content-type 應該也還是image 08/03 22:23