[問題] correlated data 的生成

作者chien533 (謠指部總司令)

站內Statistics

標題[問題] correlated data 的生成

時間Fri Jan 16 10:29:48 2009

網路上大部分關於 correlated data 的模擬生成大概都是用 cholesky decomposition 來完成不過目前所接觸到的範例，無論是用哪種程式都是先分別生成兩組資料（大都用常態分配）然後再用 cholesky decomposition 去分解 covariance matrix 再依照不同的相關係數去生新的變數.... 由於分別生成兩組資料的相關程度都很低所以可以輕易地生成相關係數從0.1~0.9的新變數不過我現在得要用兩筆現成的資料去生成新的資料但這兩筆資料的相關係數已經有0.4左右換句話說及使covariance matrix的off-diagnol設定為0 新的變數的相關係數還是0.4 請問要怎樣做才能讓新變數的相關係數降到接近零謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 152.2.149.157

→ bmka:The second paragraph is hard to understand.... 01/16 12:39

→ chien533:簡單說來我是要用現成資料生成新資料,但舊資料的相關係數 01/17 08:58

→ chien533:已經有0.4了,所以無論如何調整cov matrix,新資料的相關係 01/17 08:59

→ chien533:最小值仍為0.4,所以我想問有沒有方法降下來 01/17 08:59

→ bmka:等於沒解釋 01/18 09:50

→ bmka:what do you mean by "用兩筆現成的資料去生成新的資料"? 01/18 09:52

→ lin15:應該就是兩個本來相關性達.4的變數從中各抽一組樣本但兩組 01/18 10:01

→ lin15:樣本間的相關要很小吧 01/18 10:01

→ lin15: 母體 01/18 10:02

→ chien533:算了，看來無解，我自己已經想出替代方案了 01/19 08:15

推 tew:你說的從兩筆現成的數據隨機抽樣生成另外的實驗數據 01/19 10:56

推 tew:然後重複數千次嗎? 那樣應該要查詢拔靴法 01/19 10:57

→ bmka:先把問題說明清楚吧, 如果lin大說得是你想問的,那很簡單啊 01/19 10:59

推 tew:你是要降低相關係數?? 但有點本末倒置 01/19 11:57

推 tew:只要嘗試抽取多一點總會抽到一次相關為0的樣本 01/19 11:58

推 tew:但是結果你認為可信嗎? 01/19 11:58

→ bmka:Actually, you may just sample independently from the two 01/22 03:59

→ bmka:sets of covariate values; that is, ignoring the pairing 01/22 04:01

→ bmka:relationship. Then by definition this will result in 01/22 04:03

→ bmka:independence. 01/22 04:03

→ sneak: 但是結果你認為可信嗎? https://noxiv.com 11/09 14:41

→ sneak: sets of cov http://yofuk.com 01/02 14:49