看板 C_Sharp 關於我們 聯絡資訊
this is a book. that is a bamboo while i was a child, i'd like to play baseball when i was young, i loved playing baseball 如上兩段話. 第一段2句話4個單字有兩個單字一樣,剩下一個單字有三個字母重複. 相似度超過50%, 第二段話,逗號前相似度是50%(wh, i was) 逗號後的相似度則是不到50%(i play baseball), 我目前需要寫的程式和這個有點像 可是我想不到有甚麼好方法可以去判斷兩個句子的相似度高不高. 不知道大家有沒有想法? 還是說一定要將兩個句子一個詞一個詞拆開, 然後互相去比對? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.228.6
kirovmei:從句子長度或是間隔數(格) 也能比對長度,長度相差太多的 02/28 01:30
kirovmei:也就代表相似程度越低,但對長度相仿的就比較沒效果 02/28 01:30