→ art1: 上一篇推文有人幫我解答了,感恩 10/07 17:45
: 推 TuCH: 來源網站? 10/07 08:07
: 推 ddavid: 其實我想問的是你「為什麼」要解決,你想要解決「什麼」 10/07 10:05
因為無法正常顯示時會導致計算出來的長方形框跟正常顯示時的範圍有出入
所以讓所有字元都能正確顯示就是我想要解決的問題
: 推 ddavid: 如果來源就是那樣,這表示他就是用那個字,你用不存在該字 10/07 10:08
: → ddavid: 的字型來顯示有問題是合理的情況 10/07 10:08
: → ddavid: 如果你想要全部轉換成同一個你認為能正確顯示的字,那就是 10/07 10:09
: → ddavid: 要像簡繁體轉換一樣,建立一個字詞庫把所有可能發生此問題 10/07 10:10
: → ddavid: 的字與要轉的目標字建表,全部取代處理 10/07 10:10
: → ddavid: 基本上應該沒有任何取巧的方法 10/07 10:11
目前預想中的替代解決方案是除了特殊符號使用全字庫來顯示,其餘的都用 ubuntu 內
建的楷書字體 arphic/ukai.ttc 就能解決,雖然這替代方案也挺麻煩的,不過比起建表
來說我想還是稍微簡單一些
或是要去 windows 上找替代字型,看能不能把特殊符號跟一般中文字一併正常顯示
只是會有版權疑慮
老實說因為不同編碼問題導致無法顯示還算常見,但同樣是中文字,同樣是 unicode
一個字型可以,一個字型不可以,這種問題實在是第一次遇到,也許 windows 上的常用
字型能涵蓋的顯示範圍比 ubuntu 上的字型廣?
: → alvinlin: 看起來是從某來源抓取的一些字然想用圖片顯示結果發現有 10/07 13:41
: → alvinlin: 些字可以顯示有些字不行所以想弄懂怎麼解決。建議用regx 10/07 13:41
: → alvinlin: 。在Unicode 裡每個國家的編碼是有特定區間的。請參考sh 10/07 13:41
: → alvinlin: orturl.at/ijnG0 10/07 13:41
: → alvinlin: shorturl.at/ijnG0 10/07 13:42
前提是要先知道哪些字是全字庫無法正常顯示的吧? 有除了用肉眼觀察以外的方法嗎?
或是要怎麼從編碼上知道兩個不同編碼其實是對應到同一個中文字呢? python 有可能
辦到嗎?
--
「看在上帝的份上,我們不能當著孩子的面槍殺他的父親!」
「那我們就連孩子一起幹掉!」
「第一槍打中的是那個天真的孩子,第二槍是抱著孩子的母親。第三槍
停頓了三秒,當難以致信的父親擦拭著臉上愛子的腦漿從震驚中醒轉
過來,慢慢的轉頭看向停車的地方,分辨出是誰在攻擊他後,第三顆
子彈才將他的腦殼打飛。」 ─摘自〈狼群〉
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.173.36.83 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1602063814.A.278.html