作者mejichoco (UoU)
看板Python
標題[問題] rugular expression
時間Sat Sep 25 11:18:36 2021
這裡有一篇文章(不好意思,從簡體網站下載的題目):
性能测试是 模拟 ```大量的客户端``` 大批量的发送请求消息 给 被测的服务器。
这个网址=后面的地址
https://www.AA.com/video/tv34106411/?p=99后33面可能
还有?内容
那么,其中每个 客户端的行为 是怎样的? 需要我们先定义好。
单个客户端行为定义好 以后, 我们在第3步只要指定产生 多少个 这样的客户端就可以
了。
这个网址=后面?的地址
https://www.AA.com/video/tv34106411/?p=9还有?内容
就可以修改该文件,把文件中所有的链接末尾数字都加上。
https://www.AA.com/video/tv34106411/?p=7 还有?内容
日志文件记录了 服务端对 各个请求处理
目前使用以下解法:
https:.*tv\d*[/=?p]*
https://www.AA.com/video/tv34106411/?p=
https:.*av\d*[/=?p]*\d*
https://www.AA.com/video/tv34106411/?p=99
\d*
=99
雖然有擷取到99,但是還有全部的數字部分,像是還擷取到后33面可能的33
想問一下,有沒有辦法可以只擷取到 p= 99, 9,7 這三個數字的語法?
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.187.75 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1632539920.A.253.html
推 TitanEric: url參數有專門的lib去處理 09/25 11:36
urllib.request? import urllib?
→ TitanEric: /?p=是固定的 應該不用放方括弧 後面數字就用(\d+) 09/25 11:37
但是 使用 [/?p=]\d+ 實驗結果都會多一個 = ,
https://regex101.com/
→ TitanEric: 擷取 09/25 11:37
※ 編輯: mejichoco (101.137.187.75 臺灣), 09/25/2021 12:12:40
推 lycantrope: (https:.*tv\d*)(/\?p=)?(\d+)* 09/25 13:47
推 aalexx: 找資料一律建議英文優先,中文除了少數私人部落格,基本上 09/27 01:55
→ aalexx: 都是盜文或英文的文章不完整翻譯。有能力的話建議用英文找 09/27 01:55