推 ephesians:? 59.112.230.183 01/02 18:52
==> 在 "sonet" <sonet.all@msa.hinet.net> 的文章中提到:
> 文件前加上其他的字碼用於辨別文件的編碼
> 跟題目所說的不同,我想問的是utf8與big5混雜
> 的字串無法區分出來,事實上絕大部分的資訊
> 不會在文件的開頭標示這些資訊以供識別,而
> 多了這些識別有時反而會讓程式誤判
> 結論就是沒有好的方式來區分開來
做不到100% 可是可以做到97%
用neural network 去解吧
--
* Origin: ★ 交通大學資訊科學系 BBS ★ <bbs.cis.nctu.edu.tw: 140.113.23.3>