看板 RIPE_gender 關於我們 聯絡資訊
※ 引述《Hiro2 (我不太看傻子來信的…XD)》之銘言: : 不好意思 : 我覺得這裡有些統計概念需要修正一下 : 首先是樣本數的大小 和母體的大小是無關的 : 最小樣本數的計算公式: : n =Z(1-a)/(4 ×e^2) (請參考顏月珠 1998) : 這裡的a指的是容許誤差 : e指的是設計者所容許的抽樣誤差 : Z(1-a)就是指Z分配下信賴區間的大小 : 從上式就可以看出,樣本的大小和母體大小一點關係都沒有 要用公式之前, 請你把公式的假設想清楚 以下是引述 老怪物 寫的 http://tw.knowledge.yahoo.com/question/question?qid=1611100700911 簡單的說, 你需要 CLT, 還有群體變異數 這都和母數大小有關. ----------------------------- 若不是估計比例, 而是估計群體平均數, 那麼你還必須給予 群體標準差的初步估計. 因為信賴區間長度, 在群體分布是 常態, 或可適用中央極限定理時, 是 2*1.96*(σ/√n)*√{(N-n)/(N-1)} 或者說: 在 95%信賴水準之下的抽樣誤差是 1.96*(σ/√n)*√{(N-n)/(N-1)} 所以, 在做區間估計的目的下決定樣本數, 需要: (1) 決定信賴水準---這裡你決定了是 95%, 或 0.95. (2) 決定容許的抽樣誤差E. 例如前述連結中的 "3個百分點", 即 E=0.03. (3) 初估群體標準差σ. 在估計群體比例, 如前引民意調查之例, 群體 標準差是由群體比例決定了, 因此不需這一項, 而大多數情況是 以 p=1/2 為基礎進行計算(此時σ=1/2.) (4) 由 E = 1.96*(σ/√n)*√{(N-n)/(N-1)} 去解 n. 實際計算可以先假設是無限群體 (N 無限大), 則 E = 1.96*(σ/√n). 故得 n0 = (1.96*σ/E)^2. 然後, 如果 n0/N 在 5% 以上, 再考慮有限群體修正: n* = n0/(1+n0/N). ----------------------------------------------------------- : 既然 樣本大小和母群体無關 : 自然您說的 母群體大小差異和樣本結果能不能拿來比較更無關 : 今天從兩個不同母體 按照不同抽樣比例抽出來的樣本 : 你只要知道兩組樣本的標準差與平均值就可以算出簡單的t-value : 如果只有母群體大小相近的樣本才可以比 : 那些跨國性量化研究不全都進垃圾桶就好? : 不說這個 照這樣的邏輯 : 連癌症、愛滋病、甚至吸煙人你也沒辦用統計來分析 : 因為母群體的大小可能不只差2倍5倍,更可能是10倍20倍 : 但說實在的 這方面的統計研究還不少耶 : 一點都不需要提供母體的大小,理由很簡單 : 因為以該研究的樣本數來看 即使不是等機率抽樣 : 但這樣大的樣本的抽樣誤差已經非常非常小了 (`你還是多念點書, 多出去看看世界再來發言吧.') 有人說這句不好, 的確這句似乎是熟板常用的啟戰起手勢 但當你被人打爆之後, 其實這是最有用的話. 兩個群體母數不同你當然可以做點東西 只是記得把 `sample size' 列出來, 並且附上標準差 不然結果根本沒有用.. 這是 STAT 101 就會教的東西. 還有, 基於其他人的要求, 我不會在回應這個主題了. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 205.226.66.120 ※ 編輯: Leon 來自: 205.226.66.120 (08/15 01:10) ※ 編輯: Leon 來自: 205.226.66.120 (08/15 01:27) ※ 編輯: Leon 來自: 205.226.66.120 (08/15 02:04)
c54:謝謝說明。 08/15 02:57
※ 編輯: Leon 來自: 205.226.66.120 (08/15 03:35) ※ 編輯: Leon 來自: 205.226.66.120 (08/15 06:09)