看板 CFantasy 關於我們 聯絡資訊
※ 引述《paresky (paresky)》之銘言: : 說一個沒有直接關系但可證明中文也不一定簡潔的證據。 : 英文翻譯成中文的時候,用Word算出來的中文字數大約會是英文字數1.5倍。 : 真的要簡潔可能要靠文言文吧。 : (但文言文政治不正確呀) : 志鳥村要開新書期待中。 這個說法不太正確。 英文一個「word」(數個字母組合)可以代表一個意義; 但中文很多時候一個「字」是沒辦法代表一個意義的。 例如:吉、他,這兩個字分開和合在一起意義是天差地遠。 因此在做NLP(自然語言處理)的時候,中文直接做效率很差,通常要先做斷詞處理。 所以我認為直接比字數沒辦法表示複雜度。 回到原話題,我還是覺得中文寫程式比較不好。 之前有人提到了,用中文編碼的話compile一定會比英文還久。 從資訊理論的角度來看,英文26個字母使用率最多的e和最少的z,也不過差一百多倍。 中文我不知道常用字和罕見字的數量差異,但我想最常用前一百字的使用率,相對於使用頻率一萬以後的字,應該遠遠超過一百倍。 換句話說,中文的資訊可壓縮率應該遠大於英文,複雜度也是啊! 也可以這麼說,中文寫程式就是會又臭又長,轉譯機械語言也會更久。 ps.看來很多道友都是資訊產業的,討論好熱烈啊XD ps2.我不是資工畢業的,半路轉行軟工,有錯還請指正。 ----- Sent from JPTT on my Sony G3125. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.162.46 ※ 文章網址: https://www.ptt.cc/bbs/CFantasy/M.1526047282.A.CEB.html
chungminchun: 推 05/12 09:51
roger214 : 程式語言跟自然語言是兩碼事.....= = 05/14 04:28