作者a78998042a ()
看板R_Language
標題Re: [問題] 矩陣的處理...拜求各位大大
時間Wed Sep 6 15:10:26 2017
來個基本語法版
通常遇到行列數量差異很大的計算時
就要設法利用R語言物件的原始結構特性
像是如果你有一個矩陣 X
100萬列,20行
你需要列加總,你第一個選擇不會是
apply(X, 1, sum)
而是
X[,1] + X[,2] +....+ X[,20]
同理可證,原本的問題
# 資料生成
X = matrix(c(replicate(50, c(rep(0, 6), rnorm(1)))),,8, byrow = TRUE)
X[sample(1:dim(X)[1], 10),] = 0
# 生成結果向量
result = rep(NA, dim(X)[1])
# 依行判讀
for(i in 1:m)
result[is.na(result) & X[,i]!=0] = X[is.na(result) & X[,i]!=0, i]
result[is.na(result)] = 0
沒驗算,應該是對的吧..... XD
不知道跟data.table哪個快,晚點再比一下
※ 引述《s3714443 (metalheads)》之銘言:
: http://imgur.com/a/1s7Is
: 資料大概是長這樣
: 我想要處理的是:
: 像第8 row就有兩個非0的數字
: 那我就是取最左的那column 26.57這個數字
: 倒數第2 row 有26.43跟26.57這兩個數字
: 那就是取最左邊column的26.43
: 反正就是 先選取特定column(MA10down1~MA10donw9)之中
: 逐row先看有沒有非0的數字,有就取最左column的,沒有就取0
: 然後就是mutate出來新的一行
: 我想不到除了sapply之外的辦法了
: 但是我的資料有500多萬筆
: sapply可能會跑到電腦燒掉XD
: 感恩各位
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.82.225.9
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1504681836.A.C60.html
→ andrew43: 如果只是加總的話,rowSums還會比一個一個加再快一倍。 09/06 19:40
還真的!! 我居然不知道 XDD
※ 編輯: a78998042a (49.216.162.11), 09/06/2017 22:09:15
→ andrew43: 我也是因為看了這篇好奇才自己測了一下,順便發現的。 09/06 22:27
→ celestialgod: 不過我會覺得data.table > rowSums XD 09/07 20:29