看板 Python 關於我們 聯絡資訊
想請教一下有使用過Jieba斷詞的板友 目前遇到目前遇到狀況如下 例如說我把「超前部屬」加入自定義字典,並且把權重加得很高 但看了一下斷詞完出來的結果,只有少數被成功斷成「超前部屬」,多數仍是超前+部屬 想請問一下有甚麼方式可以讓我自定義的單字能夠優先被識別呢? 感謝各位(跪 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.96.185.59 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1666036324.A.FEA.html
lycantrope: 覺得蠻難的,斷詞後再接回去可能比較容易10/18 08:32
其實量沒有說太多,手動起來是還好 不過因為是論文想說能直接跑出來應該最好(?
johnbill: 權重高高是多高? 加到9999看看?10/18 11:43
加到超級無敵高了也是一樣哈哈,我在想應該是目標單字前後的單字也會影響斷詞結果,不 過這部分對代碼新手的我實在就沒辦法了 囧 ※ 編輯: TiffanyPany (60.96.185.59 日本), 10/18/2022 12:47:01
lycantrope: 試試jeiba.suggest_freq("超前部署",True)? 10/18 13:07
感謝 剛剛加了快速看一下好像可以達成我想要的結果 非常感謝 ※ 編輯: TiffanyPany (60.96.185.59 日本), 10/18/2022 13:55:21