看板 Python 關於我們 聯絡資訊
之前沒學過python google到的教學文章有範例 但卻不懂原理.. 請問一下我今天假使要parse證交所的收盤價 http://0rz.tw/n8qLj 是要先自己分析網頁的原始碼 找出我要的資料在哪裡 然後再parse嗎? 原始碼長得像這樣子http://ppt.cc/IhfX 請問該如何做parse 麻煩給點指導 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.243.66
mail6543210:基本上可搭配lxml,將html丟進去分析,然後用xpath娶你 06/04 22:17
mail6543210:要的部分 06/04 22:17
IAMPF:我都很笨的用urllib把整篇網頁抓下來再抓keyword把東西切開 06/04 22:39
gozule:我也是抓證交所的資料,可以直接抓csv的檔案再parse比較簡 06/04 22:55
gozule:單,不過要花點時間hack網址:) 06/04 22:55
ianleu:要不要試試這個套件 http://pypi.python.org/pypi/grs 06/05 07:50
cobrasgo:我跟3樓一樣,懶的用工具了,反正parse起來不難 06/06 14:30
flyakite:lxml, BeautifulSoup, Scrapy 06/23 07:58