作者gusion ()
看板CFantasy
標題Re: [閒聊] 起點網站部分文字無法轉繁體
時間Sun Nov 29 23:22:14 2020
最近做了一個chrome extension,把起點自定義的編碼轉換回去。
雖然基本功能已經有了,但其他功能還很簡陋
暫時還不打算上架,有興趣的可以先下載試用看看。
連結如下↓
https://github.com/lyroazo/qidian-proofreader/archive/v0.1.1.zip
安裝方式:
1. 下載擴充功能壓縮檔並解壓縮
2. 打開chrome擴充功能頁面,或者連到chrome://extensions/
3. 打開開發人員模式
4. 點選載入未封裝項目
5. 選取解壓縮的資料夾
辨識時間大約是載入完內文後約18~19秒鐘
辨識完會有訊息視窗跳出來
有時候辨識會有問題,可以重新整理換一個編碼組合
另外我有做快取功能,遇到以前辨識過的組合,就不用重新辨識,會快一點
由於我對javascript不是很熟,所以開發比較慢
也歡迎大家fork回去自己魔改
最後附上原始碼連結
https://github.com/lyroazo/qidian-proofreader/tree/master
--------
2020/12/01 更新
1. 連結更新成0.1.1版
2. 辨識時間由6~7秒變成18~19秒
因為原本起點防盜版的文字編碼只有使用58000~58122
但今天發現使用的文字編碼變成58000~58334
所以增加辨識的文字數,時間就變久了@@
※ 引述《linzero (【林】)》之銘言:
: : 有問題的會變成這樣
: : https://imgur.com/AOI8K6K
: : 推 BenShiuan : https://i.imgur.com/dmI1ooe.jpg 看起來不像正常 10/31 14:41
: 顯示 伴隨着
: 字碼 伴隨#58016
: 58016轉16進位是E2A0
: Unicode碼裡E000~EFFF是私人造字區
: 也就是大家遵守的規範裡沒定義
: 這區是讓人自己私下定的
: 這區的字如何顯示是看個別系統而定
: 比方把 冏rz 擠成一個字的寬度字形圖像
: 定義成E001
: 這樣字碼是E001(#57345)就會顯示成 冏rz
: 但在別的系統就不是
: 可能無法顯示(不支持這字碼定義)
: 或者顯示別的(比如別系統定義成 ^_< )
: 應該是起點拿去定義中文字用
: 而起點網站系統有對應字
: 在起點系統上可以被正常顯示
: 而換個系統會有問題
: (所以有些盜版網站會有顯示 #....或看來像是亂碼 的情況吧)
: 簡轉繁的機制
: 是把UNICODE碼裡的簡體字轉成UNICODE碼對應的繁體字
: 而這區自訂區的字,簡繁轉換機制無法處理
: 仍然用該字碼(像E2A0)
: 而這字碼是靠起點系統顯示的
: 所以簡繁轉換用自己的字形
: 起點自訂的字用自己訂的字形
: 且這自訂字形看來對應的是簡體
: 才造成兩者簡繁、字形不同的情況吧
: 不過 着 這個字UNICODE碼裡也有
: 不知起點為何要另外定義
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.184.12.7 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/CFantasy/M.1606663338.A.959.html
推 BenShiuan : 推 11/30 06:55
※ 編輯: gusion (111.184.12.7 臺灣), 12/01/2020 23:41:38
推 serene0414 : 感謝~ 12/14 19:14