看板 Statistics 關於我們 聯絡資訊
為什麼卡方檢定裡面的cell期望值不可小於5? 出處是什麼? 我看大家都這樣用,但是為什麼呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.71.94.11 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1401355663.A.59D.html
yhliu:因為要用常態近似. 是由於 cells 次數的聯合分布(多項分布) 05/29 17:34
yhliu:用多變量常態分布近似, 卡方統計量才會近似卡方分布. 05/29 17:35
yhliu:若 cell 的 expected counts 太低, 則難以引用常態近似. 05/29 17:36
cjjh90562:那為什麼是5? 05/29 17:57
yhliu:只是一個 rule of thumb. 05/29 18:51
celestialgod:有興趣可以看G. Cochran (1954)這篇 05/29 18:55
celestialgod:該作者指出期望值大於5會有比較好的approximation 05/29 18:58
yhliu:說 "比較好的近似"...該怎麼說呢? 比起期望值不到 5, 當然是 05/31 10:21
yhliu:"比較好". 但, 5 就夠了嗎? 只不過是個 rule of thumb, 只是 05/31 10:22
yhliu:前輩提出而當時同輩不反對, 後輩沿襲著用. 05/31 10:23