作者pupuliao (pupu)
看板java
標題[問題] 幾個 文字檔案處理 的問題
時間Sun May 20 22:11:28 2012
第一次來這裡問問題,希望不要違反板歸....
小弟 因為專題要寫 android 程式摸了一年的JAVA
不過因為 專題式走影像處理,所以 沒處理過文字檔案....
最近小弟 想寫一個程式,要從特定論壇中,下載整個討論串內容後
在擷取出 內文的部分
經過多天的google 翻書,終於弄出了 UI 和 下載 的部分
現在 問題卡在 如何開啟 讀取 html 檔跟處理後重新寫入 新的檔案中
網路上 看了許多篇文章,我又冒出了一些問題
1. 一開始我以為 開檔是透過 File ,結果我發現 開檔是使用FileReader,
再用BufferReader接住後在一次讀一行處理,可是 為何有些人的code 是沒有透過
buffer ,直接讀取呢?
小弟的目的是 把整個網頁讀取出來,過濾掉不要的部分後再重些寫入到新的檔案,
我該如何寫讀檔的部分呢?
目前我找到的方法是這樣
String filePath="...";
BufferedReader f = new BufferedReader(new FileReader(filePath));
StringBuilder S;
StringBuilder temp;
while((temp=myBufferedReader.readLine())!=null)
{
S.append(temp);
S.append("\n"); //由於readLine會消除換行符,這裡需要手工加入
}
請問一下 我這樣寫正確嗎?
String 和StringBuiilder 要再做一次轉換嗎?
2.如果我要針對讀取出來的字串,做大量的置換、刪除,我是不是應該改使用
StringBuilder,而不是使用String ? 這兩個class 使用方法相同嗎?
3.我要如何 開啟一個新檔案,並且寫入資料呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.41.230
※ 編輯: pupuliao 來自: 114.45.41.230 (05/20 22:16)
→ adrianshum:1)File 是代表檔案,不包括讀取。你的做法沒啥大問題 05/20 22:28
→ adrianshum:2) 是。不一樣 3) 找本書看吧 05/20 22:29
→ ssc24:網路爬蟲? 05/21 01:19
→ pupuliao:應該不算是爬蟲...我只是想看小說,但是txt版本的不太好 05/21 19:33
→ bitlife:為什麼不用 apache common I/O 的 IOUtils 就好了 05/21 21:40
→ pupuliao:因為....不知道有你所說的那個.... 05/21 23:03