作者swilly0906 (史威利哥哥)
看板R_Language
標題[問題]使用read.csv一直出現錯誤訊息
時間Wed Jun 7 00:58:45 2017
[問題類型]:
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
[程式範例]:
針對政府開放資料裡面的這個csv檔:紫外線監測data
http://data.gov.tw/node/6076
我第一步驟就失敗了QQ
我的指令如下:
uv <- read.csv("UV_20170606233938.csv",sep = ",",encoding = "UTF-8")
結果跑出錯誤訊息如下:
Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, numerals =
numerals,:invalid multibyte string at '<e8><8a><b1>?<ae>'
不是很懂這個錯誤訊息..
拿去餵狗之後,stackoverflow也有差不多的問題,可是我照著做
好像還是失敗了....
[環境敘述]:
R version 3.3.1 (2016-06-21)
Running under: Windows 7 x64 (build 7600)
[關鍵字]:
選擇性,也許未來有用
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.43.83.205
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1496768328.A.D8F.html
→ andrew43: windows os嗎?請先爬文,關鍵字「中文」 06/07 02:37
→ andrew43: 不過文字編碼確實是utf8沒錯 06/07 02:38
→ swilly0906: 終於成功了 謝謝樓上大大:) 06/07 10:35
→ andrew43: 可以的話歡迎分享除蟲過程,謝謝。 06/07 11:31
成功是成功啦~
但我還是不知道原理是什麼
希望andrew43或其他大大很替我解惑
我用Notepad++ 編碼部分選"切換至UTF-8碼格式(檔首無BOM)"
存檔之後
接著回R
指令改為:read.csv("UV_20170607233938.csv",fileEncoding =
"UTF-8",sep = "\t")
就成功了 然後後續動作都沒問題
只是還是似懂非懂 不知道為何這樣就可以成功...
至少我今天學到了
有問題就回Notepad++ debug一下94了QQ
※ 編輯: swilly0906 (115.43.83.205), 06/07/2017 23:09:28
→ andrew43: 看來似乎是BOM。這應該是windows user的麻煩。 06/08 00:53
→ andrew43: 多謝你回應。 06/08 00:53