看板 Python 關於我們 聯絡資訊
在做中文轉換, OpenCC強悍好用, 但是現階段的版本並沒有直接支援python, pip中的opencc則是需要先安裝OpenCC, 用ctype載入, 在包裝跨平台上似乎較不便 於是用OpenCC本身的字典檔, 寫了純用python3的opencc, 不需要額外的套件 使用方式就是把opencc這個資料夾放到專案中, 然後import就可以了. 效能上沒有跟原本OpenCC比較過, 不過在字數不多的轉換上都還可以接受. source code: https://github.com/yichen0831/opencc-python 使用範例: from opencc import OpenCC openCC = OpenCC('t2s') # 正體中文轉簡體中文 to_convert = '我要轉成簡體中文' converted = openCC.convert(to_convert) 原本OpenCC所有的轉換都可以使用,如hk2s, s2twp等等. 目前有的問題是如果轉換字詞時, 有兩種以上的可能時, 程式只會取第一個來用 如果有問題或改進的建議, 歡迎交流指教! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.244.41.5 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1452846348.A.0C1.html
uranusjr: 可以考慮把它變成一個 package, 方便 pip install 01/15 17:48
uranusjr: 只要加 setup.py 與一個 MANIFEST.in (用來標示哪些檔案 01/15 17:48
uranusjr: 需要被安裝) 即可, 散佈起來會方便很多 01/15 17:48
uranusjr: 另外你 redistribute OpenCC 設定檔應該附上他們的授權 01/15 17:49
yichen: 謝謝提醒,我來研究一下如何弄成package以及授權的問題 01/15 19:52