作者rg550 (杰克)
看板java
標題[問題] 請問一個關於抓取網頁的問題
時間Tue Feb 22 12:23:35 2011
public static void main(String args[]) throws Exception{
String param;
param = "id="+URLEncoder.encode("王小明","UTF-8");
URL url = new URL("
http://j.snpy.org/net/get.php?"+param);
URLConnection conn = url.openConnection();
InputStreamReader in = new InputStreamReader(conn.getInputStream(),"UTF-8");
int data = in.read();
FileWriter out = new FileWriter("page.htm");
System.out.println(param);
System.out.println("=======================================");
while(data!=-1){
System.out.print((char)data);
out.write((char)data);
out.flush();
data=in.read();
}
out.close();
以上是我的程式碼,我先送一個GET過去,回傳回來的網頁,會有"王小明"中文字出現
我在Console的部分,可以正常的顯示出來中文字,但是在我的page.htm裡面,卻無法
存成正常的中文字,而形成亂碼,想請問是那邊有了問題?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 219.84.27.29
→ pico2k:encoding的問題? 02/22 12:46
→ rg550:但我在console的部分正常顯示中文 02/22 14:18
→ PttTime:你開page.htm用瀏覽器開?若是,那瀏覽器編碼是UTF8嗎? 02/22 22:02
→ rg550:我用編輯器開 看到的就是亂碼了 正常來說 應該編輯器開 02/22 23:03
→ rg550:應該可以看到中文字 而不是亂碼吧 想請問是否我code有誤 02/22 23:05