看板 R_Language 關於我們 聯絡資訊
大致上這樣做。 ## site 座標 location <- data.frame( site.name = c("site1", "site2", "site3"), x = c(3,1,16), row.names = 1 ) ## site 距離矩陣 dist.mat <- dist(as.matrix(location)) %>% as.matrix dist.mat ## 各site物種出現豐度 spp.dt <- data.frame( spp = c("A", "B"), site1 = c(5,4), site2 = c(0,7), site3 = c(20,2) ) library(magrittr) spp.dt[, c("site1", "site2", "site3")] %>% as.matrix %>% apply(., 1, function(y) { y[y != 0] %>% names(.) %>% combn(., 2) %>% apply(., 2, function(pair) { dist.mat[pair[1], pair[2]] }) %>% max(.) }) ※ 引述《lilian0330 (俐俐)》之銘言: : 大家好,剛開始統計軟體入門,寫過Matlab跟R : 但最近在處理資料常常不知道怎麼解決error... : [問題] : 要做物種出現的「最大距離」,例如有三個地點,在三個點之間有三個不相等的距離。 : 而物種A出現在site1跟site3,所以距離就是distance(1-3) : 物種B出現在site1,2,3,但因為2跟3比較遠,最大距離是distance(2-3) : 我目前已經做出來兩兩site之間的distance matrix : 但是我不知道用while迴圈怎麼讓R自動判斷這個物種的「最大距離」 : 資料形式 : Species| site1 | site2 | site3 | max_distance : ------------------------------------------------------- : A | 5 | 0 | 20 | distance(1-3) : B | 4 | 7 | 2 | distance(2-3) : 我目前想到的邏輯是 : table[1,2]-table[1,3]!=table[1,2]|table[1,3] : 依序做成這個物種的「所有距離」,最後再用max()選擇「最大距離」 : 想問問大家如果寫成while loop怎麼寫比較好呢? : [環境敘述]: : R version 3.3.2 (2016-10-31) : Platform: x86_64-w64-mingw32/x64 (64-bit) : Running under: Windows >= 8 x64 (build 9200) : locale: : [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 LC_CTYPE=Chinese : (Traditional)_Taiwan.950 : [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950 LC_NUMERIC=C : [5] LC_TIME=Chinese (Traditional)_Taiwan.950 : attached base packages: : [1] stats graphics grDevices utils datasets methods base : other attached packages: : [1] sp_1.2-4 phyloseq_1.19.1 BiocInstaller_1.24.0 : readxl_0.1.1 ggplot2_2.2.1 : [6] vegan3d_1.0-1 vegan_2.4-2 lattice_0.20-34 : permute_0.9-4 : loaded via a namespace (and not attached): : Error in x[["Version"]] : subscript out of bounds : In addition: Warning messages: : 1: In FUN(X[[i]], ...) : : DESCRIPTION file of package 'Rcpp' is missing or broken : 2: In FUN(X[[i]], ...) : : DESCRIPTION file of package 'jsonlite' is missing or broken -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.135.110.74 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1491299743.A.AAF.html
lilian0330: 感謝!我研究一下! 04/04 21:16
lilian0330: 我跑完了可以執行,但換成原始資料後遇到一個問題 04/04 21:46
lilian0330: geodist[pair[1], pair[2]] : no 'dimnames' attribut 04/04 21:46
lilian0330: for array 04/04 21:46
andrew43: 你比較我的資料matrix和你的看是不是少了欄名或列名 04/04 22:00
andrew43: 真的解不開就直接提供你的部份資料。 04/04 22:01
andrew43: 若你可以看懂code,相信這只是個小問題,修一下即可。 04/04 22:03
lilian0330: 我找到了,距離矩陣沒有原本的樣本名字 04/04 22:06
lilian0330: 但是因為我要用經緯度算,所以使用gdistance package 04/04 22:07
lilian0330: 中的spDists(),只有在輸出成csv的時候是有site的 04/04 22:08
andrew43: 那好辦,就多幫它補上即可。 04/04 22:21
lilian0330: 謝謝你!我補上了 04/04 22:24
lilian0330: 現在新的 Error in combn(., 2) : n < m 04/04 22:24
lilian0330: m是2,n是什麼呀? 04/04 22:26
andrew43: 你檢查是不是有某個site只有一個物種。應該是這個原因 04/04 22:28
andrew43: 有的話,這段code要修以跳脫這種例外。 04/04 22:29
andrew43: 說反了,是不是某個物種只出現在一個site。 04/04 22:30
lilian0330: 喔喔有的,大概有70%以上~ 04/04 22:32
lilian0330: 這種狀況distance定義=0 04/04 22:34
andrew43: 把那些物種列都挑掉,或是改寫成if else 04/04 22:34
andrew43: 下次把這種明顯的例外一起說明,別人才能一併處理。 04/04 22:35
lilian0330: 好的> <抱歉提問的時候沒有想到這是特例...謝謝! 04/04 22:37
lilian0330: if x = sum(x) else接原本的code?但我不確定x要改哪裡 04/04 23:01
andrew43: 我再回一個 04/04 23:09
location <- data.frame( site.name = c("site1", "site2", "site3"), x = c(3, 1, 16), row.names = 1 ) dist.mat <- dist(as.matrix(location)) %>% as.matrix dist.mat spp.dt <- data.frame( spp = c("A", "B", "C"), site1 = c(5, 4, 0), site2 = c(0, 7, 0), site3 = c(20, 2, 1) ) library(magrittr) spp.dt[, c("site1", "site2", "site3")] %>% as.matrix %>% apply(., 1, function(y) { if (sum(y >= 2)) { # 處理某 spp 只在 1 個以下 site 出現 y[y != 0] %>% names(.) %>% combn(., 2) %>% apply(., 2, function(pair) { dist.mat[pair[1], pair[2]] }) %>% max(.) } else { 0 } }) ※ 編輯: andrew43 (125.230.106.85), 04/04/2017 23:10:56 ※ 編輯: andrew43 (125.230.106.85), 04/04/2017 23:17:33
lilian0330: 阿阿不行,出現 Error in dist.mat[pair[1], pair[2]] 04/05 01:17
lilian0330: : subscript out of bounds 04/05 01:17
lilian0330: 想詢問這邊pair的功能是什麼呢? 04/05 01:19
andrew43: 你大概不懂apply怎麼用。把你一小部分資料貼出來吧。 04/05 01:22
andrew43: 再看到底是你卡在哪裡。 04/05 01:23
andrew43: 你把 dist.mat[pair[1], pair[2]] 改成 print(pair) 就 04/05 01:24
andrew43: 可以看到pair實際上是什麼。 04/05 01:24
lilian0330: 我看到pair了,但是三筆data有五個結果(site),不太懂 04/05 01:32
andrew43: 那就是combn的結果,即所有site的兩兩組合。 04/05 01:32