看板 RegExp 關於我們 聯絡資訊
有string如下,大致上就是允許「年月日」這樣的順序, 有時可以沒有年,有時可以沒有日,但若是「年-日」 就應拆分成兩個日期。 我亂try 了一下,不太寫的出來,最像樣的如下。但「4年」 竟然抓不到,所以是錯的。6年7日也沒分開。 import re string = '1月 1日 2年 2月 2 日 3年3月 4年 5年5月 6年 7日' match = re.findall('([\d\s]+年)*([\d\s]+月)*([\d\s]+日)*', string) print(match) 執行結果 >>> [('', '1月', ' 1日'), (' 2年', ' 2月', ' 2 日'), (' 3年', '3月', ''), (' 5年', '5月', ''), (' 6年', '', ' 7日'), ('', '', '')] -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.83.16 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1469975924.A.007.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: ggirls (114.136.83.16), 07/31/2016 23:25:29 ※ 編輯: ggirls (114.136.83.16), 07/31/2016 23:36:28
mars90226: https://regex101.com/ 測試網站 08/01 01:38
mars90226: 你用*而不是?,所以4年跟5年那個一起match了 08/01 01:38
mars90226: ([\d\s]+年)?([\d\s]+月)?((?<!年)[\d\s]+日)? 08/01 01:45
mars90226: 這樣應該可以 08/01 01:46
ggirls: 謝謝。用*有點不適合。另一個要求是6年 7日應該要拆成兩組 08/01 02:25
ggirls: 日期,有辦法做到嗎? 08/01 02:25
mars90226: 我這個就可以拆成兩組了,你拿去試試看? 08/01 22:48
mars90226: 就是在"日"那一組加了前面不能是"年"的條件 08/01 22:48
ggirls: 抱歉,之前漏看了你加了這個條件。的確是可以拆成兩組了。 08/02 09:29
ggirls: 目前在看有沒有可能不要比對出空的結果。例如 08/02 09:31
ggirls: (' 6年', '', ''), ('', '', ''), ('', '', '7日'), 08/02 09:31
※ 編輯: ggirls (42.72.25.216), 08/02/2016 09:35:03
ggirls: 我用 Python3.4。 08/02 09:35
※ 編輯: ggirls (42.72.25.216), 08/02/2016 11:45:55
mars90226: 這部分應該不太行,大部分處理regex capturing都是有 08/02 16:40
mars90226: ()就會分配一個變數給他,不管有沒有抓到 08/02 16:40
mars90226: 當然我不太熟Python,有可能有特定method可用 08/02 16:41
ggirls: 6年 7日 間的 ('','',''),在年月日後再加入\s*?就可以避 08/02 17:55
ggirls: 開,只是最後還是會產生一組空的。最後還是要全部刪一遍, 08/02 17:55
ggirls: 沒什麼意義。 08/02 17:56
ggirls: 你的解法算全面了。現在還在看s25的解法,有點卡關,呵。 08/02 17:58