作者Vulpix (Sebastian)
看板Math
標題Re: [機統] 估計母體平均觀念
時間Tue Mar 12 00:32:43 2019
※ 引述《OfficeGL (妤欣)》之銘言:
: 一直搞不清楚估計
: 看了原文書跟中文版越搞越模糊
: 我的認知
: 想要從有限樣本 n 來估計母體平均
: 這個 n 實在混亂
: 我認為 n 是每次sample的個數
: 當然 n-> 無限大,那當然平均數會收斂到母體平均
到這裡為止,你用到的東西是「大數法則」。(前提是有母體平均。)
不管是強版本還是弱版本,只要母體有平均,
樣本平均就會以某種形式收斂到母體平均。
: 而每次sample n筆會得到一次抽驗平均
: X1, X2, X3, ... 一直抽樣下去 ...
: 而上述過程也是一個隨機變數
: 我們叫做 K, K ~ Normal
在這個階段,你用上了「中央極限定理」。
大致上是這個意思:[(X1+X2+...+Xn)/n-μ]/(σ/√n) 會收斂到標準常態分佈。
顯然,這次不只要有母體平均μ,母體標準差σ也不能是∞。
實務上常常會用這個想法:
(X1+X2+...+Xn)/n 差不多是一個常態分佈,平均μ、標準差σ/√n。
: 而E[K]用來推估母體平均
你的 K 是什麼,我不太清楚,姑且先當作是 (X1+X2+...+Xn)/n 吧。
從上面可以知道 E[K] 就是μ,不是大概好像彷彿,兩個數字就是相等。
然後大數法則保證只要 n 很大,(X1+X2+...+Xn)/n 的抽樣值就很接近 E[K]。
: VAR[K] 則表示上面式子的風險性高不高,有就是用來算信賴區間
信心水準約 68% 的信賴區間大概是 [k-σ/√n, k+σ/√n]。
所以問題在於我們不知道怎麼估計σ。
幸好,經過一番計算,E{ [(X1-K)^2+...+(Xn-K)^2]/(n-1) } = σ^2。
所以如果 n = 50 的話,只要重複取好多次 50 筆數據,我們就可以近似出 σ^2 了!
假設又要做 50 次的話,光是為了估算母體標準差,就要取 2500 筆數據……
(事實上要得到類似的近似,可以用 (x1-x2)^2/2 共 25 組數據平均。
如果為了對稱性,可以用 50*49/2=1225 組數據平均,
畢竟 X1 沒有和 X2 被綁在一起的理由。而這會得到一樣的樣本標準差。)
先補一個假設:試驗的母體分佈應該沒有很爛,相信 E[X^4] 一定是存在的。
用 S^2 稱呼剛剛那一串 [(X1-K)^2+...+(Xn-K)^2]/(n-1) 吧。
第二個幸好,除了 E[S^2] = σ^2 以外,
算一算可以得到 Var(S^2) = E[(S^2-σ^2)^2]
= (E[(X-μ)^4]-σ^4)/n + 2σ^4/n(n-1),
與 E[(K-μ)^2] = σ^2/n 類似,說明了 S^2 大致上只在 σ^2 附近閒逛。
所以 S^2 的取樣值,差不多就能直接當作 σ^2 的估計值了。
此即樣本標準差之所以為「樣本」「標準差」。
: 可是我看題目
: 都是例如抽50筆
: 這50筆的平均跟標準差 就拿來估計信賴區間了
: 這50筆不是只是一次抽樣而已嗎?
: 一次抽樣就可以估計母體?
: 不是應該要算E[K]跟Var[K]來估計信賴區間嗎?
重點在於我們用到大數法則和中央極限定理,所以在 n 夠大的狀況下,
K 只在母體平均附近閒逛,跟 E[K] 根本差不多;
而 Var[K] = σ^2/n,又 S^2 也只在 σ^2 附近閒逛,
所以 Var[K] 幾乎就是 S^2/n 的取樣值,不用再平均(除非還想再提高近似程度)。
: 有高手幫忙教學嗎~
: 真的頭暈腦脹
這篇說到的所有近似都有程度的問題,理論上 n 愈大就近似得愈好。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.13.112.58
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1552321966.A.FCE.html
→ hsnuyi : 你的抽樣也要夠random 不然只有n大沒意義 很多時候 03/12 01:47
→ hsnuyi : 是在抽樣就出了問題 03/12 01:47
→ Vulpix : 是的,還有iid這個前提。如果是天平量質量這種簡單 03/12 02:18
→ Vulpix : 的測量,才不太需要擔心。 03/12 02:19
※ 編輯: Vulpix (163.13.112.58), 03/12/2019 02:38:34
→ Vulpix : 抽樣方法出問題這件事,應該可以視為更換母體吧, 03/12 04:41
→ Vulpix : 一樣會有一個分佈,只是不是原本母體的分佈而已。 03/12 04:42
※ 編輯: Vulpix (163.13.112.58), 03/12/2019 16:27:31
※ 編輯: Vulpix (163.13.112.58), 03/13/2019 16:25:47
※ 編輯: Vulpix (163.13.112.58 臺灣), 12/27/2019 05:57:50