看板 Python 關於我們 聯絡資訊
小弟目前剛剛開始在學習爬蟲,可以抓取到附圖的超連結,但不知道如何將後面的一些文 字(標題、發布時間、發布的地點等...)抓取下來,網站本身結構有些複雜,不能單單用 標籤抓下來,經過發問之後,得到的回應是能透過URL定位資訊後,再透過(例 :20+[span-title].length+2)將位置定下來,之後透過迴圈抓取資料,但不知道該如何下 手,來此請求各位大大的幫助。 http://screenshot.net/0ol0vs3?tw -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 134.208.97.130 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1464519394.A.D5D.html ※ 編輯: cow1487 (134.208.97.130), 05/29/2016 19:01:15
kenduest: 用 BeautifulSoup 拆解網頁內容會單純很多 05/29 19:10