作者inch446 (inch446)
看板Python
標題[問題] 國圖標準中心爬蟲
時間Sun Dec 10 21:41:43 2017
小弟第一次接觸Python爬蟲,
目前需要寫一個程式爬國家圖書館標準圖書中心的資料,
http://isrc.ncl.edu.tw/search_result_isrc.aspx
即是用一首音樂的ISRC(類似音樂的身分證字號),
去抓該首音樂的資料,如中文歌名、歌、曲、詞等,
直接在該網站搜尋的結果如下圖,
https://i.imgur.com/gQnrkbS.png
但小弟在網路上都找不到類似的專案,
請問各位大大該如何下手是好?謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.35.8.54
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1512913321.A.827.html
→ vi000246: 這個很簡單啊 去google requests的get用法吧 12/10 23:23
→ ckvir: 先理解一下http 運作吧 12/11 00:19
→ zo6596001: 正好是用GET方法,把url最後的"search_string="改成 12/12 03:15
→ zo6596001: 你要的字串就好。 這樣應該可以收到HTML。 12/12 03:16
→ zo6596001: 剩下只要解析HTML的資料就好。 12/12 03:17
謝謝各位大大~已經成功抓到資料了
※ 編輯: inch446 (114.35.8.54), 12/12/2017 13:32:23