作者youmax210139 (youmax)
看板java
標題[問題] 中文字串處理
時間Mon Dec 19 03:42:05 2011
我想把讀入檔案中的"純"中文句子保留下來 讀入的文章偏學術性
所以會有很多數學符號
我用正規表示式
if(sentence.contains("[a-zA-Z0-9]*"))
//pass
可是仍然會出現
句子1:由實驗結果可知p=0.6
句子2:進行filter的種類特性
請問像句子1中的p(數學符號)該怎麼過濾掉
還有為什麼句子2明明有英文卻沒被過濾掉
有人知道為什麼嗎??? 小弟感激不盡!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 182.235.172.26
※ 編輯: youmax210139 來自: 182.235.172.26 (12/19 03:43)
→ AI3767:請看仔細API, contains方法的使用 12/19 03:56
→ youmax210139:我改成matchs了 可是一樣有同樣的狀況 12/19 08:49
※ 編輯: youmax210139 來自: 182.235.172.26 (12/19 08:50)
推 LPH66:* 表示"零"或多個 因此它符合空字串 於是無論如何都過 12/19 11:52
→ gwokae:matches是完全符合,部分符合是find。 12/19 23:34