看板 Statistics 關於我們 聯絡資訊
網路上大部分關於 correlated data 的模擬生成 大概都是用 cholesky decomposition 來完成 不過目前所接觸到的範例,無論是用哪種程式 都是先分別生成兩組資料(大都用常態分配) 然後再用 cholesky decomposition 去分解 covariance matrix 再依照不同的相關係數去生新的變數.... 由於分別生成兩組資料的相關程度都很低 所以可以輕易地生成相關係數從0.1~0.9的新變數 不過我現在得要用兩筆現成的資料去生成新的資料 但這兩筆資料的相關係數已經有0.4左右 換句話說及使covariance matrix的off-diagnol設定為0 新的變數的相關係數還是0.4 請問要怎樣做才能讓新變數的相關係數降到接近零 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 152.2.149.157
bmka:The second paragraph is hard to understand.... 01/16 12:39
chien533:簡單說來我是要用現成資料生成新資料,但舊資料的相關係數 01/17 08:58
chien533:已經有0.4了,所以無論如何調整cov matrix,新資料的相關係 01/17 08:59
chien533:最小值仍為0.4,所以我想問有沒有方法降下來 01/17 08:59
bmka:等於沒解釋 01/18 09:50
bmka:what do you mean by "用兩筆現成的資料去生成新的資料"? 01/18 09:52
lin15:應該就是兩個本來相關性達.4的變數 從中各抽一組樣本但兩組 01/18 10:01
lin15:樣本間的相關要很小吧 01/18 10:01
lin15: 母體 01/18 10:02
chien533:算了,看來無解,我自己已經想出替代方案了 01/19 08:15
tew:你說的從兩筆現成的數據隨機抽樣生成另外的實驗數據 01/19 10:56
tew:然後重複數千次嗎? 那樣應該要查詢拔靴法 01/19 10:57
bmka:先把問題說明清楚吧, 如果lin大說得是你想問的,那很簡單啊 01/19 10:59
tew:你是要降低相關係數?? 但有點本末倒置 01/19 11:57
tew:只要嘗試抽取多一點 總會抽到一次相關為0的樣本 01/19 11:58
tew:但是結果你認為可信嗎? 01/19 11:58
bmka:Actually, you may just sample independently from the two 01/22 03:59
bmka:sets of covariate values; that is, ignoring the pairing 01/22 04:01
bmka:relationship. Then by definition this will result in 01/22 04:03
bmka:independence. 01/22 04:03
sneak: 但是結果你認為可信嗎? https://noxiv.com 11/09 14:41
sneak: sets of cov http://yofuk.com 01/02 14:49