作者os653 (allstar)
看板Python
標題Re: [問題] 正規表示式
時間Thu Mar 18 09:22:49 2010
import urllib
# -*- coding: utf-8 -*-
import re
def fetch(url):
page=urllib.urlopen(url).read()
print page
while True:
p=re.compile('([0-9]+-[0-9]+-[0-9]+)')
m=p.search(page).group()
print u"開獎日期:" + m
pat=re.compile(r"\d+\s+\d+\s+\d+\s+\d+\s+\d+\s+\d+")
cont=pat.search(page).group(0)
print u"開獎號碼:" + cont
p=re.compile('(>[0-9]+</font></b>)')
m=p.search(page).group()
k=re.sub(r'\D', '', m)
print u"特別號碼:" + k
# --- 下面是多加的 ---
s=p.search(page).start()+1
page=page[s:]
if not p.search(page):
break
# --- 上面是多加的 ---
url = "
http://lotto.arclink.com.tw/kj_6.html"
fetch(url)
raw_input()
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.46.157.81
→ os653:直接貼了,多加個 while 跟四行 code,你的 code 我都沒動 03/18 09:24
→ apua:s=p.search(page).end() 應該也可以? 03/18 23:36