※ 引述《yhliu (老怪物)》之銘言:
: ※ 引述《ntask (ntask)》之銘言:
: : 可是如果假設 m=n=90 s=81
: : 如果計算 x(也就是上文的N) 的期望值
: : x 的機率在 x<99時為零
: : p(x=99) 開始會大於零
: : 因此 E(X)= Sigma i*p(i) for i>=99
: : 顯然 E(X) 應當會大於 100 才對
: : 而且直觀上和 100有一些差距
: : 用100做估計應該不是很適用.....
: N 是隨機的嗎?
: 如果 N 是隨機的, 有一個先驗分布
: N ~ π(x) = P[N=x], x=0,1,2,...
: 例如假設 N 服從 Poisson(λ).
: 在 m,n,s 這三個觀測值之下, N 的後驗分布是
: π(x|m,n,s) = π(x)f(m,n,s|x)/g(m,n,s), x=99,100,101,...
: 這時可考慮
: E[N|m,n,s] = Σ x π(x|m,n,s).
: 然而這是個未知的量...即使λ已知(可能嗎?)f(m,n,s|x)
: 其中仍有未知參數(如我文中的 p,q), 因此需要估計這些
: 未知參數.
: Bayesian 的做法把 N, p(P), q(Q) 都當成隨機的, 並設
: 定它們的聯合先驗分布, 例如:
: (N,P,Q) ~ π(x,p,q) = π1(x)π2(p)π3(q)
: 而後計算 N, P, Q 在給定 m,n,s 後的後驗分布, 據以對
: N 做推論.
: 但這樣的計算, 就不是你提出問題時所設想的 "簡單" 了!
: 估計結果和 N 的真值當然有差距.
: 因為既然假設校對或檢誤結果會有疏漏, 就不可能得到完
: 整的訊息, 也就不可能完全無誤差地估計 N.
: 不同估計方法估計結果也會不同. 至於哪種方法好, 哪種
: 方法差, 不能一概而論.
照題意來說 N 應當是隨機的
然而如果就直觀來說
當我們知道 m=n=90 s=81 時
是猜 N=100 比較合理 還是 猜 N=108 比較合理?
已知 m=n=90 的話 當 N=108 時 s=81 的機率
遠大於 N=100 時 s=81 的機率
不管 N 的分布為何
所以當 m=n 時 用 m+2*(m-s) 也是一個可能的估計值
我不太曉得要怎樣說明我的想法 回去再想想
我的意思只是想解釋說為什麼我覺得 mn/s
不是一個很好的估計值
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.160.193.112