推 ghchen: elastic與solr的背後都是lucene,本身工作有用到solr,中 03/10 07:26
→ ghchen: 文處理是可以的,elastic大概也行吧 03/10 07:26
推 ahli: google elastic 全文檢索 中文 感覺蠻多人用的 03/10 10:23
→ ahli: 你看要不要參考一下他們做出來的東西來考慮一下 03/10 10:24
→ ahli: 好像還有看到類似金庸小說的search engine XD.. 03/10 10:24
推 NCUking: 中文搜尋重點在切token 關鍵字:analyzer 03/10 12:49
推 NCUking: 只要求有就好的話 用standard也是可以 03/10 12:51
推 cookie1115: elastic中文搜尋還ok 但是要調到"準"要花很多時間 03/10 14:30
推 ldkrsi: 不用管斷詞 把中文當成英文的片語搜就好 03/10 18:29
→ manaup: 中文全文檢索的靈魂就是斷詞的說... 03/10 21:55
推 coronach: es跟solr主要的差異不在底層,底下都是lucene,斷詞也 03/10 22:40
→ coronach: 都可以換,主要是看你喜歡那種API跟需要什麼功能,兩者 03/10 22:40
→ coronach: 都要注意版本差異。中文斷詞的部分就是看你的搜尋是找 03/10 22:40
→ coronach: 得到就好還是會在意正確性,前者隨便切個bigram,後者 03/10 22:40
→ coronach: 就是要建詞典跟找個好的斷詞lib 03/10 22:40
→ realbout: 中文沒斷好,會很搞笑 03/11 09:58
→ hanbz: solr跟elasticsearch對中文的支援是一模一樣的< 03/11 13:07
→ hanbz: 都是吃底層的analyzer,中文大多使用cjk,你也可以自建詞庫 03/11 13:09
→ hanbz: 要做到語意分析會很不容易 03/11 13:09
推 allan80625: 可以,建議可以下載RTF版,裡面有內建中文analyzer 03/12 00:51
→ allan80625: 再去設定你要mapping的資料庫 03/12 00:52
→ allan80625: 中文分詞器(analyzer)關鍵字:ik分詞器 03/12 00:53