[問題] rugular expression

作者mejichoco (UoU)

看板Python

標題[問題] rugular expression

時間Sat Sep 25 11:18:36 2021

這裡有一篇文章(不好意思，從簡體網站下載的題目): 性能测试是模拟 ```大量的客户端``` 大批量的发送请求消息给被测的服务器。这个网址=后面的地址 https://www.AA.com/video/tv34106411/?p=99后33面可能还有?内容那么，其中每个客户端的行为是怎样的？需要我们先定义好。单个客户端行为定义好以后，我们在第3步只要指定产生多少个这样的客户端就可以了。这个网址=后面?的地址 https://www.AA.com/video/tv34106411/?p=9还有?内容就可以修改该文件，把文件中所有的链接末尾数字都加上。 https://www.AA.com/video/tv34106411/?p=7 还有?内容日志文件记录了服务端对各个请求处理目前使用以下解法: https:.*tv\d*[/=?p]* https://www.AA.com/video/tv34106411/?p= https:.*av\d*[/=?p]*\d* https://www.AA.com/video/tv34106411/?p=99 \d* =99 雖然有擷取到99，但是還有全部的數字部分，像是還擷取到后33面可能的33 想問一下，有沒有辦法可以只擷取到 p= 99， 9，7 這三個數字的語法? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.187.75 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1632539920.A.253.html

推 TitanEric: url參數有專門的lib去處理 09/25 11:36

urllib.request? import urllib?

→ TitanEric: /？p=是固定的應該不用放方括弧後面數字就用（\d+） 09/25 11:37

但是使用 [/？p=]\d+ 實驗結果都會多一個 = ， https://regex101.com/

→ TitanEric: 擷取 09/25 11:37

※ 編輯: mejichoco (101.137.187.75 臺灣), 09/25/2021 12:12:40

推 lycantrope: (https:.*tv\d*)(/\?p=)?(\d+)* 09/25 13:47

推 aalexx: 找資料一律建議英文優先，中文除了少數私人部落格，基本上 09/27 01:55

→ aalexx: 都是盜文或英文的文章不完整翻譯。有能力的話建議用英文找 09/27 01:55