看板 Python 關於我們 聯絡資訊
手機排版請見諒 小弟最近因為作業需求 要爬交通部觀光局這個網站 以這個網址為例: https://www.taiwan.net.tw/m1.aspx?sNo=0001090 目前我寫一個自動爬蟲 他能爬出這個網址出現的景點的名稱 但我還需要更多詳細資訊是需要透過點進去各別景點才能拿到的 以’陽明山國家公園’為例 我要執行的動作是: 網頁>點擊‘陽明山國家公園’>爬取裡面詳細資訊>返回網頁>點擊‘臺北市內雙溪森林藥 用植物園’>爬取裡面詳細資訊>.......... 就這樣直到把這頁的景點資訊都爬完 想請問上述這個動作可以用什麼方式來寫嗎? 找了很多資料都還是不太了解...... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.126.122 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1530959729.A.4E3.html
f496328mm: selenium 07/07 18:36
TakiDog: requests 07/07 19:09
TitanEric: 一樓的方法 07/07 21:12
f496328mm: requests比較難,可是速度比較快,selenium比較簡單, 07/07 22:38
f496328mm: 但是比較慢 07/07 22:38
TakiDog: selenium做出來擋著,有空換requests吧 速度有差,一個 07/08 02:34
TakiDog: 寫try寫到死QQ 07/08 02:34
TakiDog: selenium比較直覺一些適合新手,但有封包概念還是用requ 07/08 02:36
TakiDog: ests之類的 07/08 02:36
coeric: 個人會用requests做,不難 07/08 22:16