→ allen1985: 什麼是發現新詞? 一個詞不在字典裡? 05/05 11:16
→ allen1985: 還是NER model 05/05 11:18
→ empireisme: 對就是一個新詞不在詞典裡,例如習大大之類的 05/05 12:31
→ locka: 應該都可以自訂詞庫吧? 05/05 18:01
→ empireisme: 自訂詞庫要依靠人力,想要利用統計方法發現新詞 05/05 18:57
推 locka: 不確定目前有沒有套件可以做到你想做的,用統計方法自動產 05/05 21:00
→ locka: 生新詞…因為中文不像英文用空格分格;每個中文字都各自有 05/05 21:00
→ locka: 意思,連接起來可能又有新的意思,連接到多長停止也沒有規 05/05 21:00
→ locka: 則…所以好像輸入進詞庫給模型訓練好像是比較常見的做法@@ 05/05 21:00
→ locka: (跪求版上NLP專家) 05/05 21:00
→ locka: 剛剛查了一下,一樓allen大大說的NER model好像就是用深度 05/05 21:09
→ locka: 學習方法自動做斷詞,原po或許可以找找看有沒有用R做這個的 05/05 21:09
→ locka: 套件(抱歉上面廢話太多QQ) 05/05 21:09
→ xiangying: 有一個頗簡單的方式是用中研院的ckiptagger,有支援做n 05/06 15:12
→ xiangying: er model,不過你要先將它用reticulate移植到R上,goog 05/06 15:12
→ xiangying: le一下有人做好 05/06 15:12
→ empireisme: 謝謝我來看一下什麼是reticulate 05/06 19:17