精華區beta R_Language 關於我們 聯絡資訊
[問題類型]: [軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) [問題敘述]: 請簡略描述你所要做的事情,或是這個程式的目的 [程式範例]: 針對政府開放資料裡面的這個csv檔:紫外線監測data http://data.gov.tw/node/6076 我第一步驟就失敗了QQ 我的指令如下: uv <- read.csv("UV_20170606233938.csv",sep = ",",encoding = "UTF-8") 結果跑出錯誤訊息如下: Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, numerals = numerals,:invalid multibyte string at '<e8><8a><b1>?<ae>' 不是很懂這個錯誤訊息.. 拿去餵狗之後,stackoverflow也有差不多的問題,可是我照著做 好像還是失敗了.... [環境敘述]: R version 3.3.1 (2016-06-21) Running under: Windows 7 x64 (build 7600) [關鍵字]: 選擇性,也許未來有用 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.43.83.205 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1496768328.A.D8F.html
andrew43: windows os嗎?請先爬文,關鍵字「中文」 06/07 02:37
andrew43: 不過文字編碼確實是utf8沒錯 06/07 02:38
andrew43: 可利用 http://tinyurl.com/mnerchs 查「中文 亂碼」 06/07 02:53
swilly0906: 終於成功了 謝謝樓上大大:) 06/07 10:35
andrew43: 可以的話歡迎分享除蟲過程,謝謝。 06/07 11:31
成功是成功啦~ 但我還是不知道原理是什麼 希望andrew43或其他大大很替我解惑 我用Notepad++ 編碼部分選"切換至UTF-8碼格式(檔首無BOM)" 存檔之後 接著回R 指令改為:read.csv("UV_20170607233938.csv",fileEncoding = "UTF-8",sep = "\t") 就成功了 然後後續動作都沒問題 只是還是似懂非懂 不知道為何這樣就可以成功... 至少我今天學到了 有問題就回Notepad++ debug一下94了QQ ※ 編輯: swilly0906 (115.43.83.205), 06/07/2017 23:09:28
andrew43: 看來似乎是BOM。這應該是windows user的麻煩。 06/08 00:53
andrew43: 多謝你回應。 06/08 00:53