看板 R_Language 關於我們 聯絡資訊
※ 引述《a78998042a (Benjimine)》之銘言: : [問題類型]: : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : [軟體熟悉度]: : 使用者(已經有用R 做過不少作品) : [問題敘述]: : 我需要將程式向量化 : 使用迴圈、apply系列的函數太慢了 : 但不用apply又做不出來 : 想詢問大家的經驗 : [程式範例]: : ###vactor的問題 : #我想將一個向量分別加上一個數字 : x = 1:3 : y = rep(0, 3) : #我想得到類似下面結果,但不用apply, 不用迴圈的做法 : sapply(x, function(x) y + x, simplify = FALSE) : [[1]] : [1] 1 1 1 : [[2]] : [1] 2 2 2 : [[3]] : [1] 3 3 3 我猶豫了一下要怎麼回你XD 不過我覺得sapply, lapply夠快了,而且for也很好用 我寫了一個簡單的測試,我不認為這會是你程式速度的瓶頸: PS: 相信你的y不是全部0,不然用mapply + rep最快 y <- 1:3e4 x <- 1:1e4 st <- proc.time() z1 <- sweep(array(y, c(length(y), length(x))), 2, x, '+') proc.time() - st # user system elapsed # 8.72 0.45 9.19 st <- proc.time() z2 <- sapply(x, function(xi) y + xi) proc.time() - st # user system elapsed # 3.32 0.48 3.83 all.equal(z1, z2) # TRUE st <- proc.time() z12 <- sweep(matrix(rep(y, length(x)), length(y)), 2, x, '+') proc.time() - st # user system elapsed # 8.93 1.10 10.05 all.equal(z1, z12) st <- proc.time() z22 <- sapply(x, function(xi) y + xi, simplify = FALSE) proc.time() - st # user system elapsed # 0.58 0.45 1.05 st <- proc.time() z3 <- lapply(x, function(xi) y + xi) proc.time() - st # user system elapsed # 0.53 0.17 0.70 all.equal(z22, z3) # TRUE st <- proc.time() z4 <- vector('list', length(x)) for (i in seq_along(x)) z4[[i]] <- y + x[i] proc.time() - st # user system elapsed # 0.61 0.04 0.65 all.equal(z4, z3) # TRUE : ###array的問題 : #我想將array不同維度的物件,扣除不同數字 : temp.ar = array(matrix(0, 2, 3), c(2, 3, 2)) : #我想得到類似下面的結果 : sapply(1:2, function(x)temp.ar[,,x] + x,simplify = FALSE) : [[1]] : [,1] [,2] [,3] : [1,] 1 1 1 : [2,] 1 1 1 : [[2]] : [,1] [,2] [,3] : [1,] 2 2 2 : [2,] 2 2 2 : #另一個問題是,sapply會將物件轉成list,增加後續處理上的難度 : #例如我無法直接對list取round : #使用sapply的simplify又會將破壞結構,之後可能需要再重新架構 : #但如果結構是array就可以直接做一些函數運算 : #不知道大家有這方面的經驗可以分享嗎 : #謝謝! arr <- array(0, c(2, 3, 1e4)) st <- proc.time() z <- sweep(arr, 3, 1:1e4, '+') proc.time() - st # user system elapsed # 0.00 0.02 0.02 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.87 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1458548400.A.66C.html ※ 編輯: celestialgod (140.109.74.87), 03/21/2016 16:44:54
a78998042a: 謝c大,我現在遇到的問題是,我需要將函數向量化 03/21 18:41
a78998042a: 那使用R內建的向量化函數,很難直接增加程式的效率 03/21 18:42
a78998042a: 那單一維度參數的向量化很容易,但多維度參數涉及許多 03/21 18:43
a78998042a: 陣列的使用技巧,我覺得我的問題是在對基本物件的不熟 03/21 18:44
a78998042a: 悉,遂想上來請教大家的經驗 03/21 18:45
a78998042a: 可能是長久依賴apply的關係,對於要怎麼快速運用基礎 03/21 18:47
a78998042a: 語法快速做到類似apply的事情,就沒有太多經驗 03/21 18:48
a78998042a: 一些情況下,讓R的apply幫助向量化是很沒有效益的 03/21 18:50
a78998042a: 我覺得apply是將所有情況考慮後,所做出的function 03/21 18:51
a78998042a: 他無法針對單一問題做到最佳化,所以就想上來請教各種 03/21 18:53
a78998042a: 基礎物件的語法撰寫計巧,可以幫助程式撰寫的效率這樣 03/21 18:55
我不知道你為什麼覺得有一定的基礎物件語法能夠幫助你提速 就以你提的第一例子來說,迴圈跟sapply/lapply就很夠用了 包成一個函數或是因此去寫一個c++ function並沒有太大的意義 如果你主要的對象都是矩陣或是陣列的話 那麼你依靠sapply系列函數並沒有什麼缺點 慢都會在BLAS的部分,而非R語法的問題 至於對行列運算的apply,都可以用sweep取代 其他加速方式還有使用多執行緒、用C++ 在R上面,就我的認知而言,for跟sapply已經是很好用的工具了 剩下的是你對矩陣的熟悉度,去做manipulation,而非語法或是函數問題 這部分,你要有明確的例子,才有辦法給你一些建議 ※ 編輯: celestialgod (140.109.73.232), 03/21/2016 20:18:43
JackBaska: 我其實看到覺得lapply跟sapply會慢也覺得很怪,通常是 03/21 20:51
JackBaska: Algorithm沒弄好或沒有充分運用到該用的型態 03/21 20:52
JackBaska: 不過for很慢是肯定的....可惜recursive有上限5,000 03/21 20:52
JackBaska: 如果現有的,stackoverflow找不到滿意的解,歡迎Rcpp一下 03/21 21:15