作者legnaleurc (CA)
看板C_and_CPP
標題Re: [問題] unicode fopen
時間Tue Oct 12 22:14:43 2010
※ 引述《deepking (wnuiayldh)》之銘言:
: 標題: [問題] unicode fopen
: 時間: Tue Oct 12 21:35:01 2010
:
: 目前只找到先讀進來再用mbstowcs將char轉成wchar_t
: 在linux上,
: 有沒有辦法直接讀進來就是wchar_t ?
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc)
: ◆ From: 140.117.133.131
: 推 legnaleurc:要把 encoded text 弄成 unicode 嗎? 10/12 21:38
: → deepking:是要做中文比對,是這樣做嗎= =? 10/12 21:39
這個問題可以很複雜也可以很簡單, 重點只有:
比對的兩個(或多個)來源字串是不是使用同一種文字編碼?(ex: Big5, UTF-8 ... etc)
如果都一樣的話, 單純的 strcmp 就可以輕鬆解決
但是如果不一樣, 或是要做更準確的操作(比方說要正確取得字串長度)
你可以利用 iconv.h 達成編碼轉換的效果
詳細請看這個範例
http://www.gnu.org/software/libc/manual/html_node/iconv-Examples.html
因為 mbstowcs 不是正解, 它不能針對不同的文字編碼轉換出正確的文字
--
自High筆記(半荒廢)
http://legnaleurc.blogspot.com/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 112.104.125.199
推 deepking:thx 確實需要字串長度 10/12 23:16
推 deepking:如果比較byte會有可能在兩個字中間誤判成另一個字嗎? 10/12 23:19