看板 Python 關於我們 聯絡資訊
不好意思!! 小弟為新手 在JIEBA斷詞的過程中遇到編碼的問題 想請教一下各位高手,是否有方法可以解決或是我哪裡沒注意到 麻煩提點一下 程式碼: #-*- coding: utf-8 -*- # -*- coding: cp950 -*- import jieba jieba.set_dictionary('dict.txt.big') ret = open ('speech.txt', "r",encoding = 'utf-8').read() seglist = jieba.cut(ret, cut_all=False) import json hash = {} for item in seglist: if item in hash: hash[item] += 1 else: hash[item] = 1 json.dump(hash,open("count.json","w",encoding ='utf-8'),ensure_ascii=False) fd = open("count.csv","w",encoding ='utf-8') fd.write("word,count\n") for k in hash: fd.write("%s,%d\n"%(k.encode("utf8"),hash[k]))------>目前已經查出為這行程式的問題 但不知道如何修改可以輸出成中文,依照目前程式輸出為ASCII的編碼 拜託了~~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.159.33 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1486208790.A.AC3.html
ckc1ark: open指定encoding='utf-8'了 write的時候拿掉encode試試 02/04 20:39
tommy780507: 謝謝樓上 問題解決了!! 但我可以問一下 原因嗎? 02/04 22:15
GoalBased: 你知道py3媽 02/05 02:50
tommy780507: 沒有 我來研究一下 02/05 15:37
chehsunliu: 推py3,好用明瞭 02/05 19:32