看板 Statistics 關於我們 聯絡資訊
※ 引述《gsuper (綠色蘇打心)》之銘言: : 一顆骰子的機率分布(uniform dis *6個事件的pdf皆相等*)屬於古典機率 discrete uniform distribution 跟 uniform distribution 不一樣喔 : 如果骰子超過一顆 也仍屬古典機率 但不為uniform dis : 古典機率擁有以下特徵 : "母體平均數和標準差 : 可以直接用常識計算出來 : 不需經過長久的取樣和估計而得知" 前兩句話跟第三句話有什麼關係? 再者, 如果不確定骰子是不是fair 怎麼能不經過"取樣"去"估計" population mean and standard deviation : 所以 df=6-1=5 即可 上一段的敘述, 跟這句對d.f.的說明完全扯不上關係 : 反觀需要多減1個自由度的狀況 : 稱之為 Intrinsic model 這是什麼? : 注意! 這種修正只適用於 r*k 的 category data : 也就是特指適用於此題目的統計方法 (r*k chi square--合適度檢定) d.f. of the chi-square test 是由null hypothesis (H0) 及alternative hypothesis (H1) 決定 (在做goodnes-of-fit test 時, alternative hypothesis就是saturated model.) d.f.則是H1跟H0下的parameter space 維度的差 以原來討論的題目為例 在H1(saturated model)之下,骰子每一面出現的機率要滿足 p1 + p2 + ... + p6 = 1 所以自由參數的數目有五個 在 H0 之下, p1 = p2 = ... = p6 = 1/6 自由參數的數目有0個 所以chi-square test 的 d.f. 為 5-0 = 5 試問,如果想檢驗 H0: p1=2*p2, likelihood ratio test 的 d.f.應該是多少? 再用同樣的想法去推 r*k table 的 chi-square test 應該就清楚了 H0: probability distributions are the same in k groups. 自由參數有 r-1 個 H1: saturated model 自由參數有 (r-1)*k (每個group的probability distn 可能不同) chi-square test 的 d.f. 為 (r-1)*k - (r-1 ) = (r-1)*(k-1) 當然你也可以找到其它計算d.f.的解釋方法 eg. the number of cells minus the reduction in degrees of freedom (r * k) - (r + k - 1) 都可以參考 : 最簡單的觀察 : 可以從計算pdf的公式來看 : Poisson的公式中 : 有一個母數 u 的估計值 : u 是經過長久的取樣 : 而得到能被信任的 "母數" 很明顯的你搞不清楚 population parameter 跟 estimator 的不同 : 也就是從 estimator (X bar) 進化成 parameter (u) "進化"?? 你可以說它converge in probability or almost surely to the true parameter. 但是random variable 就是 random variable. : 因此多了一個被估計的parameter : (你無法算出一年平均會有幾個颱風 : 只能用實測的方式取得 X bar : 然後很多的 X bar 再進化成 u) : 因此有這個估計的u : 自由度再縮減一個 : df=6-1-1=4 : 若是 Normal dis : 被估計的母數有兩個 : "u" , "標準差" : 所以 df=6-1-2 = 3 : : 一般的Normal dis 或是 Poisson dis : df仍然只有減一 : 這裡的減2減3只是針對此種統計方法的修正 : 並不具有普遍性.... 上面 d.f.的算法完全不知所云...跳過不看 如果對Normal 或 Poisson或是其它 probability model 的檢定有興趣 請查 likelihood ratio test : : 請B大手下留情 Relax, I don't bite. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 編輯: bmka 來自: 71.126.187.93 (03/20 12:33)
gsuper:不好意思 本來要打 K samples 的 intrinsic model 03/20 15:15
gsuper:不小心寫成 r*k samples.... 已修正 03/20 15:15
gsuper:我的重點在於 原po起先不曉得這種統計方法的df如何修正 03/20 21:15
gsuper:我就跟他說可從PDF的公式來判斷 並非意指全部的df都這樣搞 03/20 21:16
gsuper:所以這篇文章屬於條件機率的 不對全部的df有普遍性 03/20 21:17
gsuper:而我說的 estimator的進化就只是透過 sampling dis 03/20 21:45
gsuper:再搭配CLT收束的結果 題這個只是和前面的古典機率做比對 03/20 21:46
gsuper:目的是突顯出 intrinsic model該針對什麼情況而使用 03/20 21:48
bmka:Do you know what you are talking about?你提到"古典機率", 03/21 00:40
bmka:"intrinsic model"你真的了解這指的是什麼嗎? 03/21 00:41
bmka:"修正" d.f.?沒聽過這種說法..."條件機率"!?哪來的條件機率? 03/21 00:42
bmka:而且d.f.不是只看pdf, 重要的是搞清楚H0 & H1 03/21 00:52
sneak: 不好意思 本來要打 https://noxiv.com 11/09 14:50
sneak: 而且d.f.不是只看p https://daxiv.com 01/02 14:52