看板 Soft_Job 關於我們 聯絡資訊
請問我想在我的資料庫建構一個full text search 而且需要能夠支援中文字型 請問elastic search能夠做到嗎? 某A朋友曾經隨口跟我說過solr 但是某B跟我說solr對於中文的支援度非常差 或是該用什麼其他的engine? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 207.141.218.17 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1489085099.A.922.html
ghchen: elastic與solr的背後都是lucene,本身工作有用到solr,中 03/10 07:26
ghchen: 文處理是可以的,elastic大概也行吧 03/10 07:26
ahli: google elastic 全文檢索 中文 感覺蠻多人用的 03/10 10:23
ahli: 你看要不要參考一下他們做出來的東西來考慮一下 03/10 10:24
ahli: 好像還有看到類似金庸小說的search engine XD.. 03/10 10:24
NCUking: 中文搜尋重點在切token 關鍵字:analyzer 03/10 12:49
NCUking: 只要求有就好的話 用standard也是可以 03/10 12:51
cookie1115: elastic中文搜尋還ok 但是要調到"準"要花很多時間 03/10 14:30
ldkrsi: 不用管斷詞 把中文當成英文的片語搜就好 03/10 18:29
manaup: 中文全文檢索的靈魂就是斷詞的說... 03/10 21:55
coronach: es跟solr主要的差異不在底層,底下都是lucene,斷詞也 03/10 22:40
coronach: 都可以換,主要是看你喜歡那種API跟需要什麼功能,兩者 03/10 22:40
coronach: 都要注意版本差異。中文斷詞的部分就是看你的搜尋是找 03/10 22:40
coronach: 得到就好還是會在意正確性,前者隨便切個bigram,後者 03/10 22:40
coronach: 就是要建詞典跟找個好的斷詞lib 03/10 22:40
realbout: 中文沒斷好,會很搞笑 03/11 09:58
hanbz: solr跟elasticsearch對中文的支援是一模一樣的< 03/11 13:07
hanbz: 都是吃底層的analyzer,中文大多使用cjk,你也可以自建詞庫 03/11 13:09
hanbz: 要做到語意分析會很不容易 03/11 13:09
allan80625: 可以,建議可以下載RTF版,裡面有內建中文analyzer 03/12 00:51
allan80625: 再去設定你要mapping的資料庫 03/12 00:52
allan80625: 中文分詞器(analyzer)關鍵字:ik分詞器 03/12 00:53