看板 Database 關於我們 聯絡資訊
※ 引述《savealone (嘴砲馬)》之銘言: : 我們做類似搜循引擎的系統,有做全文檢索 : 在處理英文關鍵字時,斷句都能順利找到符合的資料 : 但處理中文關鍵句時,因為斷句的關係,並沒有找到所有應該列出的資料 : 例如,搜尋"資料"只會找出剛好滿足"資料"的結果 : 但不會列出"資料庫"的搜查結果 : 但搜"資料庫"列出的查詢結果則不相同 : 請問版上的神人有不一樣的解法,或是介紹好用的插件 第一,這根本不是「斷句」的問題,也不是「斷詞」的問題,你只是要全文檢索而已。 第二,如果用 SQL 的話,那像板友的推文所說,用 LIKE '%資料%' 就可以找到 所有包含「資料」的項目。 第三,但看起你要做的是 search engine,難道 search engine 是用 SQL 做的嗎? 這樣會非常慢,尤其是 LIKE '%something%' 這種語法, 非常慢,要 linear time,也無法透過建立 index 改善。 或許你要重新思考是否使用 SQL 作 "search engine"。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.31.73 ※ 編輯: Huangs 來自: 140.112.31.73 (12/12 16:15)
xam:強 12/12 23:22