看板 R_Language 關於我們 聯絡資訊
來個基本語法版 通常遇到行列數量差異很大的計算時 就要設法利用R語言物件的原始結構特性 像是如果你有一個矩陣 X 100萬列,20行 你需要列加總,你第一個選擇不會是 apply(X, 1, sum) 而是 X[,1] + X[,2] +....+ X[,20] 同理可證,原本的問題 # 資料生成 X = matrix(c(replicate(50, c(rep(0, 6), rnorm(1)))),,8, byrow = TRUE) X[sample(1:dim(X)[1], 10),] = 0 # 生成結果向量 result = rep(NA, dim(X)[1]) # 依行判讀 for(i in 1:m) result[is.na(result) & X[,i]!=0] = X[is.na(result) & X[,i]!=0, i] result[is.na(result)] = 0 沒驗算,應該是對的吧..... XD 不知道跟data.table哪個快,晚點再比一下 ※ 引述《s3714443 (metalheads)》之銘言: : http://imgur.com/a/1s7Is : 資料大概是長這樣 : 我想要處理的是: : 像第8 row就有兩個非0的數字 : 那我就是取最左的那column 26.57這個數字 : 倒數第2 row 有26.43跟26.57這兩個數字 : 那就是取最左邊column的26.43 : 反正就是 先選取特定column(MA10down1~MA10donw9)之中 : 逐row先看有沒有非0的數字,有就取最左column的,沒有就取0 : 然後就是mutate出來新的一行 : 我想不到除了sapply之外的辦法了 : 但是我的資料有500多萬筆 : sapply可能會跑到電腦燒掉XD : 感恩各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.82.225.9 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1504681836.A.C60.html
andrew43: 如果只是加總的話,rowSums還會比一個一個加再快一倍。 09/06 19:40
還真的!! 我居然不知道 XDD ※ 編輯: a78998042a (49.216.162.11), 09/06/2017 22:09:15
andrew43: 我也是因為看了這篇好奇才自己測了一下,順便發現的。 09/06 22:27
celestialgod: 不過我會覺得data.table > rowSums XD 09/07 20:29