看板 Liu 關於我們 聯絡資訊
在今天看來,嘸蝦米一個很大的敗筆之一是一碼字編的奇爛無比 ,可能在劉老一開始發明嘸蝦米的年代並沒有教育部這類的字頻表( 但在199X年這類經過電腦統計的字頻表報告早已出現了。) 一碼字A:對,字頻序號第91。 一碼字G:機,字頻序號第144。 一碼字I:後,字頻序號第59。(勉強算還可以) 一碼字M:滿,字頻序號第293。 一碼字N:南,字頻序號第333。 一碼字P:備,字頻序號第447。 一碼字T:通,字頻序號第239。 一碼字V:要,字頻序號第37。(勉強算還可以) 一碼字Y:益,字頻序號第707。 一碼字Z:整,字頻序號第367。 前幾年開始發展的師大大師輸入法的一碼字如下: 是、有、說、來、時、為、在、的、我、個、大、中、 一、了、人、以、年、可、所、要、小、好、國、不、開、 會、能、這、到、就。(大多數在字頻前30名內,少數是在 字頻前100名內。) 要不是那個大師輸入法延用我長久以來都學不會的倉頡 字根,以及很奇怪的拆字順序(不符合一般的筆順方式), 不然我搞不好會去學它看看。 所以,我建議嘸蝦米真要改革的話,一碼字和二碼字可 以考慮按照字頻去編排。 PS:中央研究院有個漢字構形資料庫的功能及相關研究 報告真是強大,有興趣的人可以下載來玩看看。 -- 表一:字頻總表 說明: 1.本表根據樣本統計所得之單字數為 5731 字,頻次總數為 1982882次。 2.本表排序依字的出現頻次高低排列。 3.本表部首筆畫據教育部《重編國語辭典修訂本》(1995)所分。 ╔════╤══╤═╤═╦════╤════╤════╗ ║ 字 頻 │ │部│筆║出 現│ 累 積 │累 積║ ║ 序 號 │ 字 │首│畫║頻 次│ 頻 次 │百 分 比║ ╟────┼──┼─┼─╫────┼────┼────╢ ║ 1 │ 的 │白│08║ 32739 │ 32739│ 1.651 ║ ║ 2 │ 不 │一│04║ 24362 │ 57101│ 2.879 ║ ║ 3 │ 一 │一│01║ 22524 │ 79625│ 4.015 ║ ║ 4 │ 我 │戈│07║ 19414 │ 99039│ 4.994 ║ ║ 5 │ 是 │日│09║ 17698 │ 116737│ 5.887 ║ ║ 6 │ 人 │人│02║ 17638 │ 134375│ 6.776 ║ ║ 7 │ 有 │月│06║ 14346 │ 148721│ 7.500 ║ ║ 8 │ 了 │亅│02║ 12721 │ 161442│ 8.141 ║ ║ 9 │ 大 │大│03║ 12416 │ 173858│ 8.767 ║ ║ 10 │ 國 │囗│11║ 10660 │ 184518│ 9.305 ║ ║ 11 │ 來 │人│08║ 10620 │ 195138│ 9.841 ║ ║ 12 │ 生 │生│05║ 10256 │ 205394│ 10.358 ║ ║ 13 │ 在 │土│06║ 9988 │ 215382│ 10.862 ║ ║ 14 │ 子 │子│03║ 9708 │ 225090│ 11.351 ║ ║ 15 │ 們 │人│10║ 9454 │ 234544│ 11.828 ║ ║ 16 │ 中 │|│04║ 8751 │ 243295│ 12.269 ║ ║ 17 │ 上 │一│03║ 8668 │ 251963│ 12.706 ║ ║ 18 │ 他 │人│05║ 8554 │ 260517│ 13.138 ║ ║ 19 │ 時 │日│10║ 8311 │ 268828│ 13.557 ║ ║ 20 │ 小 │小│03║ 8061 │ 276889│ 13.963 ║ ║ 21 │ 地 │土│06║ 7580 │ 284469│ 14.346 ║ ║ 22 │ 出 │凵│05║ 7437 │ 291906│ 14.721 ║ ║ 23 │ 以 │人│05║ 7423 │ 299329│ 15.095 ║ ║ 24 │ 學 │子│16║ 7306 │ 306635│ 15.464 ║ ║ 25 │ 可 │口│05║ 7202 │ 313837│ 15.827 ║ ║ 26 │ 自 │自│06║ 7199 │ 321036│ 16.190 ║ ║ 27 │ 這 │辵│11║ 7175 │ 328211│ 16.552 ║ ║ 28 │ 會 │曰│13║ 7044 │ 335255│ 16.907 ║ ║ 29 │ 成 │戈│06║ 6996 │ 342251│ 17.260 ║ ║ 30 │ 家 │宀│10║ 6979 │ 349230│ 17.612 ║ ║ 31 │ 到 │刀│08║ 6857 │ 356087│ 17.958 ║ ║ 32 │ 為 │火│09║ 6838 │ 362925│ 18.302 ║ ║ 33 │ 天 │大│04║ 6799 │ 369724│ 18.645 ║ ║ 34 │ 心 │心│04║ 6762 │ 376486│ 18.986 ║ ║ 35 │ 年 │干│06║ 6350 │ 382836│ 19.307 ║ ║ 36 │ 然 │火│12║ 6264 │ 389100│ 19.622 ║ ║ 37 │ 要 │襾│09║ 6225 │ 395325│ 19.936 ║ ║ 38 │ 得 │彳│11║ 6193 │ 401518│ 20.249 ║ ║ 39 │ 說 │言│14║ 6151 │ 407669│ 20.559 ║ ║ 40 │ 過 │辵│13║ 6028 │ 413697│ 20.863 ║ ╚════╧══╧═╧═╩════╧════╧════╝ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.216.248.148
aaaaa0703:這個好像每次都會被拿出來討論 04/29 07:46
aaaaa0703:問題是大家都習慣了,而且常用字是會變的 04/29 07:47
aaaaa0703:而且一碼字要變的話2碼字是不是也會被牽動呢? 04/29 07:49
aaaaa0703:好像還有在板上看過如果改了之後的速度分析之類的 04/29 07:50
aaaaa0703:但是還是很希望看到更有效率的字碼! 蝦米加油! 04/29 07:52
toni09:你說的 獨眼龍都知道 04/29 08:56
我記得很久以前,我曾寫信給行列輸入法發明人有關這個問題,不過 他說會影響到舊的使用者,所以也不願意改革,後來我就改用嘸蝦米了。 設個「,,sp8」模式之類的,要用更改過一碼字、二碼字的新版的人 ,就能很容易地變更輸入模式了,要用舊的,還是用新的,可以由使用 者選擇,所以這種方式並不會影響舊的使用者。(至於預設那種輸入模 式,也可以自行設定,這根本不是問題。) 重點是一碼字、二碼字要怎麼選擇,這才是最大的問題。教育部的字 頻表、詞頻表是最大編修依據(不過最新的版本好像也是民國八十七年的 事情吧?)但希望嘸蝦米的公司要改的話,要好好地研究,一次就改好。 (這種重大的改版也是有一定的商業利基,並不會沒有回報。) 民國八十七年常用語詞調查報告析介(教育部的網站): http://140.111.34.54/files/site_content/M0001/87news/index1-2.htm?open ※ 編輯: ilanese 來自: 61.231.229.245 (04/29 10:21)
Ross0916:請找標題 "一碼字" 很久以前討論過了.. 04/29 13:37
Ross0916:除了字頻 也要考慮跟原字根的相關性什麼的 04/29 13:38
Ross0916:而且當然這個字頻未必跟每個人的日常生活用字符合 04/29 13:38
Ross0916:想一想 大新倉頡這些全部算計在內了 04/29 13:39
Ross0916:簡單說大新倉就是把這些先進武器全裝上去了QQ 04/29 13:40
Ross0916:現在嘸蝦米不管怎麼改 速度要贏大新倉幾乎不可能 04/29 13:41
現行的嘸蝦米輸入法一碼字有很多也只是沾個邊而已,就是直接硬背 而已,更多是莫名其妙硬背的,當初都有辦法硬背了,為何現在無法背那 幾個字呢? 對(最後一碼A?不然我也不知道要怎麼牽連了?) 機(完全不曉得為何是G?) 後(第二碼I?) 滿(完全不曉得為何是M?) 南(第二碼N?) 備(第一碼P?) 要(完全不曉得為何是V?) 益(完全不曉得為何是Y?) 整(最後一碼Z?) ※ 編輯: ilanese 來自: 61.216.243.111 (04/29 16:40)
Hemiola:機唸起來就是 G 啊,要就是很重要所以硬背 04/29 17:02
那「滿」大概就是唸起來像M吧? 那「益」大概就是唸起來像Yi吧? ※ 編輯: ilanese 來自: 61.231.231.217 (04/29 17:28)
plane0747:今天如果要你改"桌子"其實是椅子的義,"椅子"其實是桌子 04/29 18:03
plane0747:的義,不用多,10個就夠讓你崩潰了XD 04/29 18:03
banqhsia:我覺得現在的一碼字就很好了唉XD 04/29 20:02
banqhsia:滿、南、益、整、備、機、高、通、以 我都是用音記的 04/29 20:03
banqhsia:如果照您的邏輯的話...那至為什麼是P呢? 04/29 20:04
Ross0916:倒不是聲討原來的「沒道理」,只是原來的「字頻不夠高」 04/29 20:39
Ross0916:但想想就算前 26 名硬塞好了! 真能勝大新倉嗎? 04/29 20:40
嘸蝦米的一碼字塞進一到十的數字,已經先天不足了(如果依字頻來說, 除了「一」、「十」外,大多是二碼字就夠了。) 如果想要贏大新倉頡的話,光改一碼字是不夠的,連二碼字都得異動了。 例如:嘸蝦米的「國」這個字還得最少打三碼,連二碼字都不是,也應該 適時地改一下吧? 如果要勝大新倉頡的話,我覺得並不難,一碼字、二碼字是關鍵。(問題 是舊的輸入法使用者,叫他們重新背那些資料,可能會受不了。) 更何況那些打字隊的,為了速度,本來就是硬背硬練的。而一般人如果那 些兩碼字不是常常打的話,或許就會忘了,而用一般拆字的方式了。(那為什 麼嘸蝦米還會輸呢?就是因為一碼字、二碼字編排的不好。) ※ 編輯: ilanese 來自: 61.231.233.102 (04/29 22:58)
banqhsia:我覺得這樣就很夠用了啊.. 04/29 22:59
toni09:哈 我有參加過打字隊 現在要改 還滿難的 都定型了 04/29 23:00
Ross0916:本來輸入法就是在硬塞與易記間求取平衡 04/30 04:47
Ross0916:大新倉頡還多用四個鍵呢,就算一二碼字全都按順序硬塞 04/30 04:48
Ross0916:可能也不行.. 而且沒有人會願意 @@ 04/30 04:48
大新倉頡應該還是延用倉頡原本那一套的小字根,只是大新倉頡 使用最多四碼吧?(因為我沒學過,僅看資料。) 用小字根來拆碼,遇到結構複雜一點的字通常會拆碼拆到四碼、 五碼(因為倉頡還得取字首最多取兩碼、字身最多取三碼,大新倉頡 是取四碼而已,怎麼取碼,我就不知道了。) 用過小的字根來拆碼,非常違反中字字形結構的原理,有許多字 是為拆而拆,說難聽點,是硬背硬拆罷了。(大新倉頡官網自稱約100 個字根而已,嘸蝦米的基本字根大約2XX個。) 如果不考慮到一碼字、二碼字,以及重碼字問題的話,理論上嘸 蝦米的打字速度是會比大新倉頡快的。 但實際上,為何近幾年來的比賽成績,大新倉頡是比嘸蝦米快呢 ?真只有重碼字的問題嗎?(而且我認為嘸蝦米的重碼字問題還未必 會比大新倉頡嚴重喲!) 答案還是一碼字、二碼字是不是採用字頻表來編排的問題嘛! 只是舊的使用者不想重新再背再學習罷了…… 但我已經提出一個解決方法了,就是用「,,sp8」之類的功能來 切換新舊的一碼字、二碼字的拆碼模式,根本不會影響到舊的使用者 。 ※ 編輯: ilanese 來自: 61.231.230.142 (04/30 11:03)
Ross0916:你可以看看"大新倉頡與嘸蝦米輸入法之輸入績效比較研究" 04/30 13:38
Ross0916:關於你說的這些點大概都有比較到,以及「平均取碼數」 04/30 13:39
biblio:根據樓上的那篇論文: 04/30 14:24
biblio:「研究結果顯示:在理論分析方面,大新倉頡輸入法的鍵盤配 04/30 14:24
biblio:置、平均取碼數及輸入法的選字率皆優於嘸蝦米輸入法。實驗 04/30 14:24
biblio:評估驗證了理論分析的評估結果,在輸入速度方面,大新倉頡 04/30 14:25
biblio:輸入法之輸入速度比嘸蝦米輸入法之輸入速度快;在輸入錯誤 04/30 14:25
biblio:率方面,大新倉頡輸入法之輸入錯誤率比嘸蝦米輸入法之輸入 04/30 14:26
biblio:低(P=0.004<0.01)。 04/30 14:26
ducksteven:http://163.23.5.22/pdf/9422537.pdf 樓上這篇論文 05/01 03:43
carymask:唔唔… 十個受試者,這個樣本數會不會也太少了點吶? 05/01 11:00
wind50321:相信十年後的理由還是一樣… 05/04 01:51
Eckes:推這篇 05/05 07:14
xcraft:推~覺得多出來一個送字模式會更好,這樣不會影響舊的使用者 05/05 14:35
大新倉頡有個功能是可以恢復第三代倉頡的一碼字輸入模式。 真要改的話,嘸蝦米可仿效大新倉頡的作法,變換為新的一碼字 及二碼字輸入模式,根本不會影響到舊的使用者。 本來輸入法就是一直改良的,大新倉頡將第三代倉頡改為四碼輸 入及依照字頻表順序來對一碼字、二碼字及重碼字的選字上作改良, 嘸蝦米輸入法也可以這麼作的。 ※ 編輯: ilanese 來自: 61.216.243.117 (05/05 19:21)
XXZDX:推這篇 我也是蝦米族 嘸蝦米真的有它的敗筆在 我們要正視它 05/06 18:53
OverInfinity:推,蝦米族期望見到進化,從蝦米變成龍蝦吧 05/07 22:53