看板 Python 關於我們 聯絡資訊
各位先進好,小弟剛自學python沒多久,最近在練習一個高鐵時刻表的爬蟲卻 一直卡關,不知道問題出在哪,用的是python3.6版 程式碼如下: import requests from bs4 import BeautifulSoup url = 'http://www.thsrc.com.tw/tw/TimeTable/SearchResult' form_data = { 'StartStation':'977abb69-413a-4ccf-a109-0272c24fd490', 'EndStation':'9c5ac6ca-ec89-48f8-aab0-41b738cb1814', 'DepartueSearchDate':'2019/01/30', 'DepartueSearchTime':'09:30', 'SearchWay':'DepartureInMandarin' } #原例子是用SearchDate,但在高鐵網頁按F12看到是DepartueSearchDate,不知有錯嗎? response_post = requests.post(url, data=form_data) soup_post = BeautifulSoup(response_post.text, 'lxml') soup_post 原本要用下面的方式來記錄般車,但是用美麗湯解析後發現class裡面根本沒有column1 不知道問題出在哪? # 所有班車(train_number) td_col1 = soup_post.find_all('td', {'class':'column1'}) train_numbers = [] for tag in td_col1: # print(tag) train_number = tag.text train_numbers.append(train_number) 有嘗試加header或是用urllib的方式,但好像都查詢不到 跪求高手解惑~謝謝! 原例: https://github.com/music1353/pyHowFun/blob/master/LESSON4%20%E7%88%AC%E8%9F%B 2%E5%AF%A6%E6%88%B0%20-%20%E9%AB%98%E9%90%B5%E6%99%82%E5%88%BB.ipynb -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.42.252 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1548676772.A.061.html ※ 編輯: chaotic0307 (118.169.42.252), 01/28/2019 20:00:38
jasonfghx: WOW 01/29 12:03
cutekid: https://rextester.com/SSKM79694 01/29 13:18
chaotic0307: 抱歉不懂樓上大大的意思,點開裡面的也發現無法執行 02/03 01:04
nini200: 我header全加 也不能爬 知道怎麼解決再分享一下 02/03 13:19