作者art1 (人,原來不是人)
看板Python
標題Re: [問題] 請問密碼檢測的正規表達式
時間Fri Feb 1 18:20:36 2019
※ 引述《jijuan ()》之銘言:
: 看到一個題目是長度為8的密碼,
: 必須至少含有一個大寫字母、一個小寫字母和一個數字,
: 找到這個正規表達式,
: ^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8}$
我會這樣解讀
.*\d 代表一個數字前面可以為任意字元
或說任意字元之後一定要出現一個數字
.*[a-z] 代表一個小寫字母前面可以為任意字元
或說任意字元之後一定要出現一個小寫字母
.*[A-Z] 代表一個大寫字母前面可以為任意字元
或說任意字元之後一定要出現一個大寫字母
三個條件都用 ?= 包起來,代表這三者要同時成立才是想要的字串
?=.*\d 找到的是一個數字前方的位置,例如 abc4def
c與4之間的那個位置就符合此規則
其餘同理
至於加 .* 的理由是 ?=\d 跟 ?=[a-z] 並用會導致不存在符合的情況
我不知道要怎麼解釋比較正確,感覺上像是兩者找到的位置是不可能同時存在的
而字串 abc4efg 使用 (?=.*\d)[a-z] 篩選,符合的是 a、b、c 三筆資料
字串 abc4efg 使用 (?=.*\d)a 篩選,符合的是 a
字串 abc4efg 使用 (?=.*\d)b 篩選,符合的是 b
字串 abc4efg 使用 (?=.*\d)c 篩選,符合的是 c
字串 abc4efg 使用 (?=.*\d)e 篩選,找不到符合的
字串 4efg 使用 (?=.*\d)e 篩選,找不到符合的
加上 .* 讓原本的 \d 規則限制變寬了
: 有幾個地方不懂想請問,
: (1)?=這部分是Positive lookahead,查了一下它的定義是:
: Positive lookahead works just the same. q(?=u) matches a q that is followed
: by a u, without making the u part of the match.
: 所以第一個括號裡,是 .*\d 這一部分被視為u嗎?這樣的話q是指哪部分呢?
: 對第二個括號來說,它前面的(?=.*\d)被視為q嗎?還是每個括號都是獨立的分組?
: 還是說因為lookahead本身不會消耗字元,所以在沒有 q的情況下,就把它當作是一個
: 判斷句來用這樣?
: (2).*用來匹配所有東西,那為什麼後面還跟著\d?我現在的理解是,假設"abFj45dE"
: 是我要比對的密碼,比對到4這個數字時,abFj就是.*的部分嗎?也就是說必須符合一
: 串字元之後必須0-9之間的數字這樣?還是說(?=.*)本身就是一個特定的寫法?
: (3)另外根據語言的不同,是不是有些正規表達式中lookbehind只允許等寬長度的字串
: ?
--
「看在上帝的份上,我們不能當著孩子的面槍殺他的父親!」
「那我們就連孩子一起幹掉!」
「第一槍打中的是那個天真的孩子,第二槍是抱著孩子的母親。第三槍
停頓了三秒,當難以致信的父親擦拭著臉上愛子的腦漿從震驚中醒轉
過來,慢慢的轉頭看向停車的地方,分辨出是誰在攻擊他後,第三顆
子彈才將他的腦殼打飛。」 ─摘自〈狼群〉
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.161.122
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1549016440.A.228.html
→ s860134: 加上.*是因為 pattern 第一個字元是 ^ ,沒有前導任意長 02/01 22:35
→ s860134: 度萬用字元,會變成強制要第一個字元符合三種 assertion 02/01 22:35
→ s860134: 你的 pattern 將不會有任何匹配的可能 02/01 22:36
→ art1: 我給的例子都沒加上^ 02/02 04:02
→ art1: regex101.com標示出來的結果顯示 ?=.*\d 符合的是一個數字 02/02 04:05
→ art1: 前面的任意位置 02/02 04:06
→ art1: 而不是我說的只有 c 與 4 之間這個位置 02/02 04:07
→ art1: ?=\d 符合的才是 abc4efg 的 c 與 4 之間的單一位置 02/02 04:08
→ s860134: 你知道 search 和 match 的差別嗎? 02/02 10:24
→ art1: 有沒有消耗字元的區別? 02/02 12:36