抱歉 標題不知道怎麼下比較好
我在做一個word frequency的程式
我已經從一個大語料庫建了一個依照word frequency排的dictionary
看起來像這樣
freq = {'1000': ['i', 'the', 'you'], '2000': ['above', 'book', 'gun', 'noise'],
'3000': ['flag', 'dial', 'ban']}
根據這個frequency dictionary, 我要分析在一篇文章中的frequency range
比如說有一篇文章分析出來是這樣
inputwords = {'the': 35, 'book': 2, 'noise': 4}
也就是說在這篇文章中, 'the' 出現35次 等等
我現在的問題是, 我想要產生這樣的output
1000:35
2000:6
也就是把所有在那個range裡的字的出現次數全部加起來
我試著寫了一個loop
for key in freq:
for item in inputwords:
if item in freq[key]:
我現在的問題是不知道怎麼把數字相加起來
試過的方式都產生error message
不知道有沒有高手可以指點迷津
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 69.143.181.102