看板 Statistics 關於我們 聯絡資訊
我目前在使用Apache的common math3的套件來作卡方檢定的程式實作。 我要檢定的是一群二維的點是否符合某bivariate normal distribution。 由於這個套件並沒有提共api算某個範圍的機率, 所以我把就每個點當作一個分類的格子,其對應的期望機率就用pdf來查。 也就是o = 1, e = pdf所給的機率值*1 此外,二維的點都是浮點表示,所以我假設不會有重複。 這樣做的卡方檢定是OK的嗎? 謝謝了。 -- 與怪物戰鬥的人,應當小心自己不要成為怪物。 當你遠遠凝視深淵時,深淵也在凝視你。 弗里德里希·威廉·尼采 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.23.156 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1444652710.A.490.html
andrew43: 卡方的o和e都是次數, 不是機率。 10/12 22:01
andrew43: 次數的觀測值和次數在H0下的期望值,說明確一點的話。 10/12 22:04
andrew43: 所以你是把一個點都當「1次」這樣算下去嗎? 10/12 22:05
andrew43: 在單變量常態的例子中也是要分個幾群來做。 10/12 22:07
andrew43: 次數太少就不適卡方分配了,何況你都只有1次。 10/12 22:08
expiate: 我是把e的次數用機率乘上一來代表次數。 10/12 22:12
expiate: 我的確是把每次點都當一次來看待。看來還是得老老實實 10/12 22:13
expiate: 分類。更正,我是把機率乘上總共的觀測點數 10/12 22:14
expiate: 謝謝你的提點,感謝感謝 10/12 22:15
yhliu: (1) 卡方檢定是大樣本近似, 每個 cell 的期望次數不能太小. 10/13 18:53
yhliu: 你的設定完全違背這個要求. 10/13 18:53
yhliu: (2) 連續型分布要用卡方檢定, 必然要分組. 因為, 單點的理 10/13 18:55
yhliu: 論機率都是 0. 雙變量分布則不只單點機率是 0, 任一簡 10/13 18:56
yhliu: 單曲線機率也是 0. 因此定要雙向分組才可能做卡方檢定. 10/13 18:57
yhliu: (3) p.d.f. 不是機率. 當然可以利用 p.d.f. 去計算近似機率 10/13 18:58
yhliu: 但絕不是直接拿 p.d.f. 當機率用. 10/13 18:59
expiate: 再次感謝上面大德的指導。謝謝! 10/14 15:14