精華區beta EZsoft 關於我們 聯絡資訊
以下文章從鍵談坊http://forum.talkdigi.net/phpBB2/index.php的洨軟體轉載 其實這個東西已經在三交腦海中醞釀了很久 特別是看過了對岸的谷歌拼音輸入法 可以線上更新並更新詞庫 所以有了這個計畫的產生 三交的輸入法是嘸蝦米與新酷音混用 嘸蝦米為主,新酷音為輔 由於PCMan大大與新酷音團隊的努力 讓我們可以在免費卻難用的新注音與要錢佔資源的自然音 有著第三個選擇 在此要跟這些大大致意 不過用過新酷音的人都知道 新酷音在選字與斷詞有一些問題 雖然另有新酷音詞庫團隊在維護詞庫,但更新頻率稍慢, 而且似乎無法根治選字的問題 加上使用時間愈久 新酷音在選字益發錯亂且斷詞也會變得奇怪 經三交的觀察, 應該是使用者自建詞庫(hash.dat)與統計字頻率資料(us_freq.dat) 發生搭配上的錯亂所致 而且執行「存入使用者詞庫」的次數愈多,問題就愈嚴重 當然,這有可能三交才會有的情況,或說是個案也可以 在研究「新酷音詞庫修改教學」之後 摸索出以下的方法,不敢保證一定有用 卻有相當程度的解決 首先開啟HashEd.exe 執行「存入使用者詞庫」並將詞庫另存匯出 然後到以下資料夾 X:\Documents and Settings\Y\Application Data\Chewing X為磁碟機代號,通常為C Y為使用者帳號 記得解除隱藏檔隱藏的設定 接著將資料夾內檔案全數刪除,再馬上重新開機 切記,刪除後不要用新酷音打字,否則會出現錯誤訊息 開機完成後,再將先前另存的詞庫匯入即可 ============以上為心得=============== 使用過後,選字錯亂問題似乎好很多,不過這不是重點 由於新酷音使用時間一久,每個人都會累積為數不少的詞庫資料庫 雖然有新酷音詞庫計畫,但他們只有維護內建的詞庫以及修正字選擇的優先頻率 對於新詞的增加,數量似乎少了些 但是新酷音又沒有谷歌輸入法有線上詞庫可同步的機制 三交就想以鍵談坊http://forum.talkdigi.net/phpBB2/index.php 為起點,將新酷音的詞庫放上網路共享 在新酷音的詞庫線上同步機制未出現之前 把自己辛辛苦苦建立的詞庫與大家共享 然後再匯入其他人的建立的詞庫 不但可以節省訓練新酷音的時間 而且能讓新酷音選字更加聰明且好用 這樣的詞庫共享計畫或許是個過渡性的方案 但是可以讓大家在使用新酷音時更方便 何樂而不為呢? 分享的機制很簡單,就是把詞庫上傳 以鍵談坊為統一的分享平台 三交先將自己的詞庫分享給大家,附檔就是三交詞庫 讓下一個人匯入再匯出然後上傳至網路空間 命名的格式為在「檔案註解」裡加上詞庫數量與時間,如 uhash.dat(15131,071020),如附件所示 15131為詞庫輸量 071020為時間 這樣或許可以去除掉部份重複的情況,也減少錯亂 然後大家就以最新推文所上傳的詞庫為準 很快地,詞庫就會愈來愈豐富 甚至可以作為未來新酷音線上詞庫的基礎 以及讓目前詞庫維護計畫團隊所使用 以下有幾點事項要注意: 1.匯入其他人的詞庫可能會出現「部份詞重複」的錯誤訊息,這是HashEd.exe的小Bug ,可以不用管 2.由於鍵談坊有附件容量限制,上傳時記得先作壓縮 3.如果匯入之後會有選字或斷詞錯亂的情況,記得按照上述的方法,刪掉Chewing資料 夾的所有檔案,重新開機後再行匯入即可 4.由於鍵談坊可容量的附件只有256KB,就麻煩後續的網友上傳至其他的網路空間了 Orz 5.匯入請透過HashEd.exe PS.要登入會員才能下載詞庫喔 ============================================================X 以上轉載至鍵談坊洨軟體版 http://forum.talkdigi.net/phpBB2/index.php -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.64.139.192
alicekey:詞庫的確需要有更好的改進方式 10/21 00:09
alicekey:我想,你要不要來這次的開源人年會分享呢? 10/21 00:11