看板 RegExp 關於我們 聯絡資訊
大家好: 搜尋 ([一-龥,。:“”、‘’;\[\]])(\s+)([一-龥,。:“”、‘’;\[\]]) 替代 \1\3 上面的方法是我在網路上找到用來刪除中文字和中文字之間(包含些標點符號) 的多餘空白,因為使用OCR軟體辨識中文時一定會出現這現象。 一直沒辦法讓OCR軟體事先避免產生空格(OCR軟體好笨?!),所以只能事後做補救。 有些好奇項目1(和項目3)為何加\[\],不知有無特別的意義?是作者考慮不夠周詳嗎? 因為既然已經將[和]放入搜尋條件內了,為何不將類似的<和>等等也放進來? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.235.168 ※ 文章網址: https://www.ptt.cc/bbs/RegExp/M.1533505053.A.856.html
LPH66: 正規表示式的 [ ] 是字元集, 表示 [ ] 之間的任一字元 08/06 21:54
LPH66: 例 [ABC] 表示 A 或 B 或 C, 但不含 [ ] 兩個字 08/06 21:55
LPH66: 不過我不太清楚為何目標是全型字元的這條正規式會想加入 08/06 21:57
LPH66: 半型的 [ ] 就是了 08/06 21:57