[問題] wget完整網頁

作者wilson8069 (E T)

看板Linux

標題[問題] wget完整網頁

時間Thu Feb 13 23:27:48 2014

第一次發問請多多指教> < 我想利用Linux的wget去抓取網頁資料但發現我想抓的網頁含有ajax的內容想請問這樣還有方法可以抓取完整的網頁內容嗎如果wget無法做到,其他可達成的任何方法都可以... 先謝謝大家回答!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.193.36.202 ※ 編輯: wilson8069 來自: 123.193.36.202 (02/13 23:29) ※ 編輯: wilson8069 來自: 123.193.36.202 (02/13 23:29)

→ mitsui0309:wget是抓檔案用的，而且還是要知道詳細網址 02/13 23:36

推 ckclark:用chrome的dev tool看一下load完整個網頁會有哪些request 02/14 00:01

→ ckclark:再去推敲ajax抓網頁其他部份的rule 02/14 00:02

推 s25g5d4:用 headless browser 跑完網頁再輸出 02/14 00:11

→ wilson8069:http://ppt.cc/LWx~ 02/14 00:23

→ wilson8069:這邊附上網址~因為想抓取多個類似網頁的資料 02/14 00:25

→ wilson8069:所以想利用指令或是程式的方式! 02/14 00:25

推 danielsig727:(靜態)網頁內容的話我比較常用 curl 02/14 13:53

→ danielsig727:不過原 po 的狀況應該研究一下 ajax 從哪抓東西 02/14 13:53

→ danielsig727:然後直接去那抓資料，通常 ajax 的資料也比網頁 02/14 13:54

→ danielsig727:好 parse 02/14 13:54

→ wilson8069:嗯嗯,因為我用curl還是沒辦法抓完整的網頁@@ 02/14 14:03

推 ckclark:看了一下你需要資料是這個? http://tinyurl.com/k4mm9zd 02/15 15:49

→ wilson8069:就是這個!請問這東西在哪? 謝謝! 02/16 11:39

→ wilson8069:已經解決了!謝謝各位~詳見s版友的回文 02/16 14:43