作者yaowei2010 (yaowei)
看板R_Language
標題[問題] input data (非mxn)
時間Thu Oct 23 19:10:48 2014
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
input一個一開始行數不均的csv的data
[程式範例]:
我知道這問題有點蠢
但因為這個data它有1.5 GB
Excel打開到一半就掛了 還失去後面的一部分資訊
想說用R開並整理資料
沒料到這筆資料是長這樣的(在Excel看到前半部分資料)
例如:
xxx
xxx
xxx xxx ←這些xxx我都不要
xxx xxx
xxx xxx
Name ID A B C D ←從這行開始以下才是我要的資料
a b c d e f
g h i j k l
.
.
.
可是因為不是mxn 標準dataframe的格式 (假設我要的資料是m x n)
R loading進去之後就整個亂掉了 變成 k x 2
也就是我資料全部變成2個column全亂掉...
但我沒辦法開啟excel把不要的部分刪掉
請問這該怎麼辦QAQ
有什麼好建議 或挽救的整理方式
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.211.93
※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1414062650.A.30C.html
→ Wush978: 你如果知道前面不需要的資料的行數,可以用skip掉 10/23 20:37
→ Wush978: 請使用skip這個參數 10/23 20:37
推 andrew43: skip=列數 10/23 20:39
→ yaowei2010: 感謝!!!! 10/23 21:03
推 Edster: 你可以用 Notepad++ 或 Notepad2 打開大的csv, 修改檔案. 10/24 21:55
→ gsuper: read.delim("",skip=10) 這樣應該可以 10/25 00:26
→ gsuper: 另一種方式是用 scan("",what="character") 但這需要會寫 10/25 00:27
→ gsuper: 程式才能做後續處理 10/25 00:27
推 kenshin528: read.table的時候 fill=TRUE看看 10/25 14:44