[問題] 用python做parse

作者bwtalk (是黑是白)

看板Python

標題[問題] 用python做parse

時間Mon Jun 4 21:57:09 2012

之前沒學過python google到的教學文章有範例但卻不懂原理.. 請問一下我今天假使要parse證交所的收盤價 http://0rz.tw/n8qLj 是要先自己分析網頁的原始碼找出我要的資料在哪裡然後再parse嗎? 原始碼長得像這樣子http://ppt.cc/IhfX 請問該如何做parse 麻煩給點指導謝謝！ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.243.66

→ mail6543210:基本上可搭配lxml,將html丟進去分析,然後用xpath娶你 06/04 22:17

→ mail6543210:要的部分 06/04 22:17

→ IAMPF:我都很笨的用urllib把整篇網頁抓下來再抓keyword把東西切開 06/04 22:39

→ gozule:我也是抓證交所的資料，可以直接抓csv的檔案再parse比較簡 06/04 22:55

→ gozule:單，不過要花點時間hack網址:) 06/04 22:55

→ ianleu:要不要試試這個套件 http://pypi.python.org/pypi/grs 06/05 07:50

推 cobrasgo:我跟3樓一樣，懶的用工具了，反正parse起來不難 06/06 14:30

推 flyakite:lxml, BeautifulSoup, Scrapy 06/23 07:58