作者john5601 (HTC ONE年不變)
看板R_Language
標題[問題] 匯入txt讀檔問題
時間Sun Sep 6 18:21:52 2015
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
目前是有大量的txt檔需要讀入跑分析,但發現一直有部份檔案是讀入不了的
抓出兩個檔案 一個讀入有問題 一個沒有 不知道能不能請大大們幫測試看看哪裡有問題
20150101_02_passtag.txt 是正常可讀入的
20150101_03_passtag.txt 是無法讀入的
我都是用 read.table(file = file1,encoding="ASCII",sep="\t")
編碼部分都測過沒有問題
無法讀入的檔案 若是我把 sep="\t" 去掉 變成以下這樣
http://imgur.com/kIv06Ky
正常讀入的檔案應該像這樣
http://imgur.com/rjqeQBP
文字檔連結:
https://www.dropbox.com/sh/bjud8jbnqg2gpu8/AAAxmwEeUvTkAGKEJcWNHBe7a?dl=0
[程式範例]:
簡單讀檔的程式碼
http://pastebin.com/R4b93eht
[環境敘述]:
R version 3.2.0 (2015-04-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
[關鍵字]:
匯入檔案 txt 分隔符號
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.117.71.217
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1441534924.A.7B9.html
→ andrew43: 你把 ?read.table 裡 Arguments seq 一節看一下。 09/07 01:33
→ andrew43: typo... 是 sep 那一段 09/07 01:34
→ andrew43: 另外,這種內容的檔案,我會選用用 readLines() 09/07 01:37
→ celestialgod: 你的檔案裡面都沒有\t 建議用readLines就好 09/07 09:15
→ john5601: 謝a大s大 09/07 14:09
→ john5601: c大 那篇文我搜尋不到欸 09/07 14:09
→ john5601: 有找到了! 09/07 14:11
→ john5601: 請問如果用readlines讀入 09/07 14:19
→ john5601: 還是能夠把整篇文章丟分析嗎 09/07 14:20
→ celestialgod: 讀進去只是一個字串,應該可以分析吧 09/07 14:29
→ john5601: 所以只是改成逐行讀入 09/07 15:43
→ john5601: 然後讀進來的還是該txt的所有內容嗎? 09/07 15:44
→ celestialgod: 全部 09/07 16:28