[問題] 新手爬蟲爬開放式政府網站遇到困難

作者goofi0211 (姑叔城外含三次)

看板Python

標題[問題] 新手爬蟲爬開放式政府網站遇到困難

時間Thu Nov 23 01:21:51 2017

最近在爬一個法學網站的資料網址是http://jirs.judicial.gov.tw/FJUD/index_1.htm 選擇司法院--刑事補償判決日期選擇106年按查詢就會進到查詢頁面但這時候問題就來了，我的爬蟲看到的頁面似乎跟網頁所顯示的不太一樣 <frameset cols="220,*" frameborder="no" border="0" framespacing="0"> <frame src="FJUDQRY02_1.aspx?courtFullName=&v_sys=&jud_year=&jud_case=&jud_no=&jud_no_end=&jud_title=&keyword=&sdate=&edate=&page=&id=&searchkw=&v_booktype=&deepsearch=&jmain=&JSTOCK=&JDG_COMMIS=&JDG_PRESID=" name="leftFrame" scrolling="auto" noresize="noresize" id="leftFrame" title="leftFrame"> <frame src="FJUDQRY02_1.aspx?courtFullName=&v_sys=&jud_year=&jud_case=&jud_no=&jud_no _end=&jud_title=&keyword=&sdate=&edate=&page=&id=&searchkw=&v_booktype=&deepse arch=&jmain=&JSTOCK=&JDG_COMMIS=&JDG_PRESID=" name="contentFrame" id="content Frame" title="contentFrame"> </frameset> 上面這是我爬蟲所看到的部分而我想去的真正網站是src後面那串，我試過直接用爬蟲抓取src那一段再用新分頁開啟他，但這樣瀏覽器好像會擋小弟才疏學淺還請大家多幫忙以下是小弟的程式碼 from selenium import webdriver from selenium.webdriver.common.keys import Keys import time driver = webdriver.Chrome(executable_path=r'/Users/terry/chromedriver') driver.get("http://jirs.judicial.gov.tw/FJUD/FJUDQRY01M_1.aspx") driver.find_element_by_name("dy1").click() driver.find_element_by_name("dy1").clear() driver.find_element_by_name("dy1").send_keys("106") driver.find_element_by_name("Button").click() time.sleep(5) soup=bs(driver.page_source,'html.parser') elem=soup.select('frameset frame') url='http://jirs.judicial.gov.tw/FJUD/'+elem[1]['src'] driver.get(url) driver.find_element_by_link_text(u"106,台重覆,13").click() -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.185.101 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1511371315.A.AA0.html

推 ckc1ark: 要switch_to.frame http://tinyurl.com/y9pz2ryl 11/23 13:29

→ salmon12706: 工研院人工智慧課程推薦https://reurl.cc/4RDRaK 06/29 16:27