※ 引述《ntask (ntask)》之銘言:
: 可是如果假設 m=n=90 s=81
: 如果計算 x(也就是上文的N) 的期望值
: x 的機率在 x<99時為零
: p(x=99) 開始會大於零
: 因此 E(X)= Sigma i*p(i) for i>=99
: 顯然 E(X) 應當會大於 100 才對
: 而且直觀上和 100有一些差距
: 用100做估計應該不是很適用.....
N 是隨機的嗎?
如果 N 是隨機的, 有一個先驗分布
N ~ π(x) = P[N=x], x=0,1,2,...
例如假設 N 服從 Poisson(λ).
在 m,n,s 這三個觀測值之下, N 的後驗分布是
π(x|m,n,s) = π(x)f(m,n,s|x)/g(m,n,s), x=99,100,101,...
這時可考慮
E[N|m,n,s] = Σ x π(x|m,n,s).
然而這是個未知的量...即使λ已知(可能嗎?)f(m,n,s|x)
其中仍有未知參數(如我文中的 p,q), 因此需要估計這些
未知參數.
Bayesian 的做法把 N, p(P), q(Q) 都當成隨機的, 並設
定它們的聯合先驗分布, 例如:
(N,P,Q) ~ π(x,p,q) = π1(x)π2(p)π3(q)
而後計算 N, P, Q 在給定 m,n,s 後的後驗分布, 據以對
N 做推論.
但這樣的計算, 就不是你提出問題時所設想的 "簡單" 了!
估計結果和 N 的真值當然有差距.
因為既然假設校對或檢誤結果會有疏漏, 就不可能得到完
整的訊息, 也就不可能完全無誤差地估計 N.
不同估計方法估計結果也會不同. 至於哪種方法好, 哪種
方法差, 不能一概而論.
--
來自統計專業的召喚...
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
<<<>>> 把自己當成別人。把別人當成自己。把別人當成別人。把自己當成自己 <<<>>>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.233.154.145