推 c54:謝謝說明。 08/15 02:57
※ 編輯: Leon 來自: 205.226.66.120 (08/15 03:35)
※ 編輯: Leon 來自: 205.226.66.120 (08/15 06:09)
※ 引述《Hiro2 (我不太看傻子來信的…XD)》之銘言:
: 不好意思
: 我覺得這裡有些統計概念需要修正一下
: 首先是樣本數的大小 和母體的大小是無關的
: 最小樣本數的計算公式:
: n =Z(1-a)/(4 ×e^2) (請參考顏月珠 1998)
: 這裡的a指的是容許誤差
: e指的是設計者所容許的抽樣誤差
: Z(1-a)就是指Z分配下信賴區間的大小
: 從上式就可以看出,樣本的大小和母體大小一點關係都沒有
要用公式之前, 請你把公式的假設想清楚
以下是引述 老怪物 寫的
http://tw.knowledge.yahoo.com/question/question?qid=1611100700911
簡單的說, 你需要 CLT, 還有群體變異數
這都和母數大小有關.
-----------------------------
若不是估計比例, 而是估計群體平均數, 那麼你還必須給予
群體標準差的初步估計. 因為信賴區間長度, 在群體分布是
常態, 或可適用中央極限定理時, 是
2*1.96*(σ/√n)*√{(N-n)/(N-1)}
或者說: 在 95%信賴水準之下的抽樣誤差是
1.96*(σ/√n)*√{(N-n)/(N-1)}
所以, 在做區間估計的目的下決定樣本數, 需要:
(1) 決定信賴水準---這裡你決定了是 95%, 或 0.95.
(2) 決定容許的抽樣誤差E. 例如前述連結中的 "3個百分點", 即 E=0.03.
(3) 初估群體標準差σ. 在估計群體比例, 如前引民意調查之例, 群體
標準差是由群體比例決定了, 因此不需這一項, 而大多數情況是
以 p=1/2 為基礎進行計算(此時σ=1/2.)
(4) 由 E = 1.96*(σ/√n)*√{(N-n)/(N-1)} 去解 n.
實際計算可以先假設是無限群體 (N 無限大), 則 E = 1.96*(σ/√n).
故得 n0 = (1.96*σ/E)^2.
然後, 如果 n0/N 在 5% 以上, 再考慮有限群體修正:
n* = n0/(1+n0/N).
-----------------------------------------------------------
: 既然 樣本大小和母群体無關
: 自然您說的 母群體大小差異和樣本結果能不能拿來比較更無關
: 今天從兩個不同母體 按照不同抽樣比例抽出來的樣本
: 你只要知道兩組樣本的標準差與平均值就可以算出簡單的t-value
: 如果只有母群體大小相近的樣本才可以比
: 那些跨國性量化研究不全都進垃圾桶就好?
: 不說這個 照這樣的邏輯
: 連癌症、愛滋病、甚至吸煙人你也沒辦用統計來分析
: 因為母群體的大小可能不只差2倍5倍,更可能是10倍20倍
: 但說實在的 這方面的統計研究還不少耶
: 一點都不需要提供母體的大小,理由很簡單
: 因為以該研究的樣本數來看 即使不是等機率抽樣
: 但這樣大的樣本的抽樣誤差已經非常非常小了
(`你還是多念點書, 多出去看看世界再來發言吧.')
有人說這句不好, 的確這句似乎是熟板常用的啟戰起手勢
但當你被人打爆之後, 其實這是最有用的話.
兩個群體母數不同你當然可以做點東西
只是記得把 `sample size' 列出來, 並且附上標準差
不然結果根本沒有用..
這是 STAT 101 就會教的東西.
還有, 基於其他人的要求,
我不會在回應這個主題了.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 205.226.66.120
※ 編輯: Leon 來自: 205.226.66.120 (08/15 01:10)
※ 編輯: Leon 來自: 205.226.66.120 (08/15 01:27)
※ 編輯: Leon 來自: 205.226.66.120 (08/15 02:04)