推 bewilderment:高手~ 04/01 01:31
※ 引述《fish0407 (@_@..)》之銘言:
: 大家好
: 小弟做研究遇到一個問題
: m 個硬幣已經翻好正反面,放在黑箱子裡,
: 我想取 n (n<=m) 個 sample 中就猜測箱子裡有幾個正面
: 請問這樣可以計算期望誤差嗎?
: 例如誤差範圍百分比之類的~
: 應該是個和 n, m 都有關的函數嗎?
: 謝謝大家~
設有 N 個硬幣,其中 Np 個是正面, 但哪個是正面哪個是
反面觀察者不知.
今觀察者觀看了其中 n 個, 其中 x 個是正面, 則可以猜
測 p^ = x/n, 也就相當於猜測原先 N 個有 Np^ 個正面.
則 E[p^] = p, 即: 假設那 n 個是從 N 個之中隨機抽取,
那麼考慮 C(N,n) 種可能樣本, 一一計算其 p^ 之後, 這
些 p^ 的平均值等於 p. 所以 E[Np^] = Np.
用 p^ 估計 p, 有多大誤差? 最常用的表現誤差形式是所
謂 "均方誤差":
Mse(p^) = E[(p^-p)^2] = [p(1-p)/n]*(N-n)/(N-1)
當 n<<N, 例如 n<N/10 時, 常把 (N-n)/(N-1) 拿掉, 成
為
Mse(p^) = p(1-p)/n
這就是一般民調、市調在用的公式.
而用 Np^ 估計 Np, 則
Mse(Np^) = N^2 Mse(p^)
另外,也可建立所謂 "區間估計" 或 "信賴區間", 例如一
般民調常用 95% 信賴區間: 基於中央極限定理,用常態分
布近似二項分布, p 的 95% 近似信賴區間是
p^ - 1.96*√Mse(p^) ~ p^ + 1.96*√Mse(p^)
近些年來統計學者發現: 由於常態近似的一些缺陷, 改用
下列公式的信賴區間結果比較好:
假設 (N-n)/(N-1) 這個 "有限群體校正因子" 可忽略,
令 p' = (x+2)/(n+4),
令 v(p') = p'(1-p')/(n+4)
取區間為 p'-1.96*√v(p') ~ p'+1.96*√v(p')
不管是 p 的估計,或 Np 的估計, 都是常見之於各種統計
調查.
--
嗨! 你好! 祝事事如意, 天天 happy! 有統計問題? 歡迎光臨統計專業版! :)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
我們強調專業的統計方法、實務及學習討論, 只想要題解的就抱歉了!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.233.153.172