※ 引述《OfficeGL (妤欣)》之銘言:
: ※ 引述《OfficeGL (妤欣)》之銘言:
: : 一直搞不清楚估計
: : 而每次sample n筆會得到一次抽驗平均
: : X1, X2, X3, ... 一直抽樣下去 ...
: : 都是例如抽50筆
: : 這50筆的平均跟標準差 就拿來估計信賴區間了
: : 這50筆不是只是一次抽樣而已嗎?
: : 一次抽樣就可以估計母體?
: : 不是應該要算E[K]跟Var[K]來估計信賴區間嗎?
統計的 "估計" 就是要用觀測到的樣本來猜測未知的群體
特性. 如果一直抽抽不停, 這是不現實的, 所以最常見的
就是抽一組大小為 n 的樣本,而後用這觀測到的樣本特性,
來猜測群體的特性, 只有少數情形會使用多組樣本來共同
估計一個群體.
至於如樣本統計量(如平均數)的理論分布(抽樣分布), 以
及涉及 n 大時抽樣分布近似常態(CLT), 以及樣本統計量
僧趨近於其期望值或某群體參數(LLN), 這算是機率問題.
所以說統計離不開機率, 機率是統計的桹基.
: 不過我有一點想再問
: 觀測一次 n筆samples的平均 x’
: 根據中央極限定律 x’的分配服從常態分佈
: 且其期望值等於u就是母體平均
: 那應該是x’ 介於 [u-1.96sd, u+1.96sd]
: 為何在區間估計時
: 反而是說 u 介於 [x-1.96sd, x+1.96sd]
: 有95%信賴區間?
x' 介於 u-d 和 u+d 之間, 與 u 介於 x'-d 和 x'+d 之
間是二而一的事. u(這裡代表群體參數)是未知的,不可觀
測的; x'(代表統計量)是可觀測的. 統計區間估計就是用
可觀測(或已觀測)的 x' 來界定未知的,不可觀測的 u 的
範圍.
由於機率理論告訴我們: 從具有參數值 u 的群體抽樣,
統計量 x' 介於 u-d 與 u+d 之間的機率有, 例如95%,
因此我們實際觀測到 x' 後, 雖然無法知道 x' 是否介於
上列範圍之內, 也不能再談 x' 介於該範圍內的機率, 但
卻不妨礙我們說: 有 95% 的信心認為 x' 是落在 u-d 和
u+d 之間, 也就是 u 會在 x'-d 至 x"+d 之間.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.246.83.134
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1552458416.A.9F1.html