作者yichen (蒼穹之下任我行)
看板Python
標題[分享] OpenCC中文轉換python3
時間Fri Jan 15 16:25:44 2016
在做中文轉換, OpenCC強悍好用, 但是現階段的版本並沒有直接支援python,
pip中的opencc則是需要先安裝OpenCC, 用ctype載入, 在包裝跨平台上似乎較不便
於是用OpenCC本身的字典檔, 寫了純用python3的opencc, 不需要額外的套件
使用方式就是把opencc這個資料夾放到專案中, 然後import就可以了.
效能上沒有跟原本OpenCC比較過, 不過在字數不多的轉換上都還可以接受.
source code:
https://github.com/yichen0831/opencc-python
使用範例:
from opencc import OpenCC
openCC = OpenCC('t2s') # 正體中文轉簡體中文
to_convert = '我要轉成簡體中文'
converted = openCC.convert(to_convert)
原本OpenCC所有的轉換都可以使用,如hk2s, s2twp等等.
目前有的問題是如果轉換字詞時, 有兩種以上的可能時, 程式只會取第一個來用
如果有問題或改進的建議, 歡迎交流指教!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.244.41.5
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1452846348.A.0C1.html
→ uranusjr: 可以考慮把它變成一個 package, 方便 pip install 01/15 17:48
→ uranusjr: 只要加 setup.py 與一個 MANIFEST.in (用來標示哪些檔案 01/15 17:48
→ uranusjr: 需要被安裝) 即可, 散佈起來會方便很多 01/15 17:48
→ uranusjr: 另外你 redistribute OpenCC 設定檔應該附上他們的授權 01/15 17:49
→ yichen: 謝謝提醒,我來研究一下如何弄成package以及授權的問題 01/15 19:52