看板 Python 關於我們 聯絡資訊
※ 引述《timTan (用口頭禪區分年記)》之銘言: : ※ 引述《a0954153 (卓)》之銘言: : : 就是例如 有一個 test.txt , 裡面是一篇文章 : : test.txt內容如下: i am a pig pig pig pig : : 則 判別出 4 : : 有四個不同的單字 : : 我只有想到這樣做, : : import string : : t=open('test.txt') : : G={} : : a=string.split(t.readline()) : : for i in range(len(a)) : : G[a[i]]=1 : : print len(G) : : 只能拿現有的弄 : : 請問還有更好的方法嗎:( : print len(set( "i am a pig pig pig pig".split() )) 恩恩,我把它改成了這樣不知道會不會好一點 t=open(r'C:\_____.txt') G=t.readlines() K=set() for i in range(len(G)): G[i]=G[i].replace(',',' ').replace('.',' ').replace('!',' ').replace('?',' ').replace('\n',' ').split() K=K|set(G[i]) print len(K) 這樣應該可以把, . ! ? \n 都給拿掉 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 111.243.151.4
holio:那你可以試試 re.findall(r"\w+" 07/14 00:18