看板 DataScience 關於我們 聯絡資訊
作業系統:(ex:mac,win10,win8,win7,linux,etc...) 不限,詢問概念性問題 問題類別:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...) NLP 使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...) 假定是 jieba,但套別的中文句子分析程式也可以 問題內容: 如果拿現代中文的句子分析程式,像 jieba 但是把字典的部分換成古文的詞彙 這樣跑出來的結果還行嗎? 當然這個古文詞典目前是不存在的 也不是做研究用的 只是想做個把古文句子拆解的小程式 古文的範圍很廣,這樣會做不完 可能會限制範圍,像是孔孟老莊墨法之類的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.177.247 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1628319680.A.ED3.html
hsnuyi: 你字典夠強就可啊 苦工是在建立字典上 又不是分詞 08/07 19:00
st1009: 可以考慮看看中文Bert 08/07 19:36