看板 Python 關於我們 聯絡資訊
※ 引述《a856479 (thebelief)》之銘言: : 大家好,由於我沒有程式語言的基礎 : 最近試著爬網頁資料時遇到一個問題不知道怎麼解決 : 請求各位協助幫忙,謝謝! : 目標網址:https://goo.gl/02M292 : 目標資料:只要"今日十全戰法偏多"裡面出現的股票名稱 : 問題:我找不出"今日十全戰法偏多"的class或能定義它的方式, : 導致只能抓取到網頁內所有的股票名稱... : ----------以下是我目前的寫法---------- : import requests : from bs4 import BeautifulSoup : res = requests.get("http://www.sohowgood.com/TwStock/PowerKLine.aspx") : soup = BeautifulSoup(res.text, "lxml") : stocks = soup.find_all('li') : for stock in stocks: : meta = stock.find('a') : stockid = meta.getText().strip() : print(stockid) : 請問我該如何修改才能抓取到我需要的部分? 謝謝大家 我用了 PyQuery https://pypi.python.org/pypi/pyquery from pyquery import PyQuery as pq d = pq(url="http://www.sohowgood.com/TwStock/PowerKLine.aspx") lis = d('h2:contains("今日十全戰法偏多") ~ ul li a') for li in lis: print(li.attrib['title']) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 221.224.213.130 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1487406657.A.C6C.html
a856479: 感謝Wxyy大提供不同方法! 原本只試過BeautifulSoup而已 02/18 22:31