作者wu860125 (wu860125)
看板Python
標題[問題] 爬蟲取父節點後get報錯
時間Sat Feb 13 10:20:11 2021
https://i.imgur.com/wPKbqPJ.jpg
程式碼如上圖,最後一行報錯
https://i.imgur.com/nUBd4vz.jpg
是否不能在取完父節點後再用get? 或其他地方有錯?
HTML結構是<a href=“”><h3>文章標題</h3></a>
範例網址如下,想爬所有文章標題的網址,想請教應該怎麼修改? 謝謝
https://www.bnext.com.tw/categories/semiconductor
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.30.176.219 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1613182813.A.DF9.html
推 chickengod: 我猜是這樣 find_parents() return list 02/13 11:41
→ chickengod: find_parents()[0].get() 02/13 11:41
→ chickengod: find_parent().get() 02/13 11:41
→ chickengod: 然後那個 可以試試 docker + rsshub + ttrss 02/13 11:49
→ chickengod: 如果有rss的網站不用自己爬w 02/13 11:49
推 supremebboy: 學著看錯誤訊息吧 講的很清楚了 02/13 15:46
→ wu860125: 原來是find_parent() 感謝c大 02/13 16:35