Re: [問題] 矩陣的處理...拜求各位大大

作者a78998042a ()

看板R_Language

標題Re: [問題] 矩陣的處理...拜求各位大大

時間Wed Sep 6 15:10:26 2017

來個基本語法版通常遇到行列數量差異很大的計算時就要設法利用R語言物件的原始結構特性像是如果你有一個矩陣 X 100萬列，20行你需要列加總，你第一個選擇不會是 apply(X, 1, sum) 而是 X[,1] + X[,2] +....+ X[,20] 同理可證，原本的問題 # 資料生成 X = matrix(c(replicate(50, c(rep(0, 6), rnorm(1)))),,8, byrow = TRUE) X[sample(1:dim(X)[1], 10),] = 0 # 生成結果向量 result = rep(NA, dim(X)[1]) # 依行判讀 for(i in 1:m) result[is.na(result) & X[,i]!=0] = X[is.na(result) & X[,i]!=0, i] result[is.na(result)] = 0 沒驗算，應該是對的吧..... XD 不知道跟data.table哪個快，晚點再比一下 ※ 引述《s3714443 (metalheads)》之銘言： : http://imgur.com/a/1s7Is : 資料大概是長這樣 : 我想要處理的是： : 像第8 row就有兩個非0的數字 : 那我就是取最左的那column 26.57這個數字 : 倒數第2 row 有26.43跟26.57這兩個數字 : 那就是取最左邊column的26.43 : 反正就是先選取特定column(MA10down1~MA10donw9)之中 : 逐row先看有沒有非0的數字，有就取最左column的，沒有就取0 : 然後就是mutate出來新的一行 : 我想不到除了sapply之外的辦法了 : 但是我的資料有500多萬筆 : sapply可能會跑到電腦燒掉ＸＤ : 感恩各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.82.225.9 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1504681836.A.C60.html

→ andrew43: 如果只是加總的話，rowSums還會比一個一個加再快一倍。 09/06 19:40

還真的!! 我居然不知道 XDD ※ 編輯: a78998042a (49.216.162.11), 09/06/2017 22:09:15

→ andrew43: 我也是因為看了這篇好奇才自己測了一下，順便發現的。 09/06 22:27

→ celestialgod: 不過我會覺得data.table > rowSums XD 09/07 20:29