看板 Python 關於我們 聯絡資訊
大家好,小弟是自學python,上來問問題 基礎不好,請大家見諒 直接上代碼 import re page_source = 'MDCore||s|d1354d3800dd8e659acca9f54dab450f|delivery1|mixdrop|co|referrer|thumbs|jpg|vsrc|mp4|v|gQVGA8SHsiXubSB6sfcaVQ||1573136954|' req = "s|(.*?)|deliveryt" # results = re.findall(req,page_source) # print(results) 以上是小弟的代碼,page_sourece是小弟用selenium抓取下來的原始碼其中一段需要之內容 使用re(正則表達式),想提取出d1354d3800dd8e659acca9f54dab450f這段數值 但結果打印出來卻變成['', 'M', '', 'D', '', 'C', '', 'o', '', 'r', '', 'e', '', '|', '', '|', '', '', '|', '', 'd', '', '1', '', '3', '', '5', '', '4', '', 'd', '', '3', '', '8', '', '0', '', '0', '', 'd', '', 'd', '', '8', '', 'e', '', '6', '', '5', '', '9', '', 'a', '', 'c', '', 'c', '', 'a', '', '9', '', 'f', '', '5', '', '4', '', 'd', '', 'a', '', 'b', '', '4', '', '5', '', '0', '', 'f', '', '|', '', 'd', '', 'e', '', 'l', '', 'i', '', 'v', '', 'e', '', 'r', '', 'y', '', '1', '', '|', '', 'm', '', 'i', '', 'x', '', 'd', '', 'r', '', 'o', '', 'p', '', '|', '', 'c', '', 'o', '', '|', '', 'r', '', 'e', '', 'f', '', 'e', '', 'r', '', 'r', '', 'e', '', 'r', '', '|', '', 't', '', 'h', '', 'u', '', 'm', '', 'b', '', '', '|', '', 'j', '', 'p', '', 'g', '', '|', '', 'v', '', '', 'r', '', 'c', '', '|', '', 'm', '', 'p', '', '4', '', '|', '', 'v', '', '|', '', 'g', '', 'Q', '', 'V', '', 'G', '', 'A', '', '8', '', 'S', '', 'H', '', '', 'i', '', 'X', '', 'u', '', 'b', '', 'S', '', 'B', '', '6', '', '', 'f', '', 'c', '', 'a', '', 'V', '', 'Q', '', '|', '', '|', '', '1', '', '5', '', '7', '', '3', '', '1', '', '3', '', '6', '', '9', '', '5', '', '4', '', '|', ''] 查了資料,也不知道這是哪裡出了問題,只好上來提問 再麻煩大家了,謝謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.133.107 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1573116510.A.930.html
geniusofgod: results = page_source.split('|')[3] 11/07 17:16
geniusofgod: 如果不一定要用regex分出來的話 可以這樣 11/07 17:16
GeoMeTric: | 是有其用途的特殊字元。 11/07 18:51
MARGHT: “.*?\|s\|(\w+)\|.*” 11/07 19:22
s860134: 同樓上 \ 跳脫 11/08 23:39
swwy1661: 上述的方法都可解決 ,謝謝以上大神唷,感謝 11/09 11:46