推 godfat:相容是改革,不相容是革命 01/15 14:41
※ 引述《jimifish (呆呆吉米魚)》之銘言:
: UTF-8的中文字是3個byte
^^^^^^^^^^^^^^^
這個不一定
在UTF-8編碼中,中文編碼長度是不固定的。
: UTF-16是2個byte
: 照理來說,如果資料庫用UTF-16來存,應該比較便於搜尋
: 那為什麼網路上的blog或網頁大部分都是UTF-8呢?
因為utf8的編碼比utf16好,包括了字與字的切割
(很久以前瞄過的文件上說的,細節不太記得)
而且utf8相容於ascii,印象中utf16是不相容於ascii的。
在電腦界中,似乎相容舊的都比較佔優勢<( ̄ c ̄)y▂ξ
比如802.11g因向下相容802.11b所以比802.11a更受歡迎...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.16.1.95