作者umziehen ()
看板Python
標題[問題] 爬蟲新手:想抓的資訊不在html原始碼裡
時間Sat Mar 30 14:02:57 2019
大家好
我想學習爬蟲和網頁的基礎知識
想實作的例子是透過程式抓下律師公會網站上
所有的律師姓名、事務所名、事務所電話的資訊
可是以台北律師公會的網站來說
這三項資訊似乎沒有直接出現在html檔裡?
ex:以
https://member.tba.org.tw/FindLawyerDetail?LawyerId=6669為例
"馥詠德章"並沒有直接出現在html檔裡
請問如果我想完成我的實作
我所需要的網頁知識(只了解html語法夠不夠?)以及library(Beautiful Soup?)是?
有沒有推薦的tutorial、影片可以參考?
非常感謝大家!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.22.203
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1553925779.A.596.html
→ f496328mm: 以後可以去這裡找 03/30 14:57
推 windclara: 學會Chrome的F12功能! 03/30 15:23
※ 編輯: umziehen (114.137.22.203), 03/30/2019 15:27:13
※ 編輯: umziehen (114.137.22.203), 03/30/2019 15:29:32
推 chaotic0307: 買網路爬蟲實戰書或是youtube看大數學堂的課就會了 03/31 01:12
推 a11780922: ajax 03/31 17:30