※ 引述《kc655039 (NNN  )》之銘言:
: 在這邊問似乎不太適合
: 但是還是想了解一下文件比對的算法
: 就是如果要拿兩個文件來比對,
: 看看相似的程度如何,
: 這當然要有人先定義出相似度才能開始解,
: 請問一下,有沒有已經純在的算法??
: 就是那種經典的算法可以參考看看?
: 如果有先進曾聽說過哪個論文或是書籍的話
: 希望可介紹參考,感激
請找 IR 相關的書 (information retrieval),
例如下面這本是以前資訊檢索這門課的課本:
Baeza-Yates, R. and Ribeiro-Neto, B.
Modern Information Retrieval, Addison Wesley, 1999.
然後找 vector space model.
另外, 這是網路上剛剛找到的簡介:
http://isp.imm.dtu.dk/thor/projects/multimedia/textmining/node5.html
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.30.53