看板 Statistics 關於我們 聯絡資訊
※ 引述《riviera (Nikita~)》之銘言: 因為樣本很小,大概8~9個,跑了spearman correlation, adjusted for 4 other variables ; 結果跑出幾個p < 0.05的結果, 但是rho = -1, 1, or 0.99 ; 請問這是可以report的嗎? 總覺得怪怪的 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.74.68 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1681779063.A.18A.html ※ 編輯: riviera (36.226.74.68 臺灣), 04/18/2023 08:53:24
celestialgod: 或許可以看看Spearman correlation test的power ana 04/18 09:36
celestialgod: lysis 04/18 09:36
andrew43: 極端的spearman相關係數就表示二變項的大小順序幾乎完全 04/18 16:31
andrew43: 遞增或遞減。從精確檢驗來說,只要5對順序為絕對遞增或 04/18 16:33
andrew43: 遞減的資料就能達到p<0.05了,而你的情況可能是絕對遞增 04/18 16:34
andrew43: 或遞減有8-9對資料,那exact p-value已經到超級小了。 04/18 16:36
andrew43: (N=8, rho=1, exact p-value=0.00005) 04/18 16:38
andrew43: 總之,雖然樣本很小,但隨機配對出你的結果的機率很小。 04/18 16:40
andrew43: 這已經是有統計意義了。不知道有沒有解釋了你說的「怪」 04/18 16:41
andrew43: 另外,這種超小的樣本,我建議用exact p-value而不要用 04/18 17:06
andrew43: asymptotic p-value。目前看不出來你選哪一個。 04/18 17:07
謝謝兩位版友的回答 1. power analysis 我來查查,不過似乎有人在討論minimun sample size for Pearson Spearman and Kendall. May, Justine O., and Stephen W. Looney. "Sample size charts for Spearman and Kendall coefficients." Journal of biometrics & biostatistics 11.2 (2020): 1-7. 2. 算出來的p value = 0.028, 0.014, 0.002; 我再來看看怎麼算 exact p value 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.75.28 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1681893335.A.632.html
yhliu: 才 8-9 個觀測值,還 adjust by 4 variables,當然呈現表面 04/20 08:37
yhliu: 層次的高相關值。假設兩變數是獨立的,共同用 4 個變數做線 04/20 08:39
yhliu: 性迴歸取殘差,則殘差間當然存在相關,因為其中有共同的那 04/20 08:41
yhliu: 些調整變數的成分。而樣本小使得相關係數高。p 值只是表明 04/20 08:42
yhliu: 其樣本相關結果是否來源於純機會因素,何況三個結果中也只 04/20 08:44
yhliu: 有第三個顯著性高些...但顯著性高也不代表相關度比較強,更 04/20 08:45
yhliu: 別說那相關性可能來自共同調整變數的原因。 04/20 08:47
yhliu: 建議:先不做調整看簡單相關是否存在;再就擬探討相關的變 04/20 08:53
yhliu: 數個別與調整變數間的關係;最後再分析經調整後的關係,除 04/20 08:56
yhliu: 非調整變數是離散型而調整方式是分組樣本,否則個人認為調 04/20 08:58
yhliu: 整時不必採同一模型。以迴歸調整為例,X 用 Z1 調整,Y 或 04/20 08:59
yhliu: 許用 Z2。因為樣本太小,不能用太多調整變數,尤其是 X, Y 04/20 09:01
yhliu: 都用相同變數調整時。 04/20 09:02
riviera: 謝謝大大!所以你建議y用a變數adjust;x用b變數adjust;再 04/20 21:18
riviera: 再算x,y之間的correlation?避免共同使用同樣cov. adjust 04/20 21:19
andrew43: 既然有模型,何不建模做回歸?否則這些調整過的關聯性 04/20 22:38
andrew43: 可能也是假的 04/20 22:38
andrew43: 但如果要先由這麼多個變數做調整,那也應該沒有檢驗可 04/20 22:48
andrew43: 做了,樣本數不夠。 04/20 22:48
yhliu: 本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要 04/21 08:02
yhliu: 如果樣本很大,X, Y 用幾個不很重要的變數做調整亦無妨;樣 04/21 08:03
yhliu: 本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要 04/21 08:03
yhliu: 關聯的變數調整,殘差自由度小了,而且有因調整所引入的共 04/21 08:05
yhliu: 同因素,再看殘差相關已失意義。但又怕簡單相關其中有虛假 04/21 08:07
yhliu: 關聯存在,因而想用其他變數調整,那就個別找最重要的調整 04/21 08:08
yhliu: 變數。若 X, Y 找到的調整變數相同,則在做殘差間相關時要 04/21 08:10
yhliu: 同時考慮其相關是否因調整產生的。即使 X, Y 之調整變數不 04/21 08:12
yhliu: 同,也要再看兩調整變數之關聯。個人意見是多看各變數間相 04/21 08:14
yhliu: 互的關聯,而後產生一個總體的,似乎合理的解釋。 04/21 08:16
yhliu: 或者,仍依正式的方法,用相同變數做調整,但只用一個調整 04/21 08:17
yhliu: 變數。可以4個變數一一去試,而後做出綜合的解釋。 04/21 08:21
yhliu: 以 n=9 來說,如果同時用4個變數調整 X, Y 而後分析 X, Y 04/21 08:22
yhliu: 的關聯,不談因調整而產生的共同因素,單論殘差各剩 4個自 04/21 08:24
yhliu: 由度,等於只剩4個樣本點,這樣算出來的相關指標焉能不虛高 04/21 08:26
andrew43: 同意老師的觀點。小樣本又要背後容許多個參數,沒有空 04/21 18:19
andrew43: 間做推論了。 04/21 18:19
andrew43: 更別說,小樣本做回歸調整,調整出來的東西不確定性很 04/21 18:23
andrew43: 也沒有納入之後的分析,覺得很不可靠。 04/21 18:23
riviera: 謝謝大家的討論!我想就bivariate correlation 04/21 20:26