原文可到 telnet://bbs.ncku.edu.tw 的 Statistics 版,
版面搜尋 "回收率", 或按 z 進精華區 9→12 閱讀.
以計量資料來觀察回覆率的影響太複雜, 有許多參數需要
假設。....若考慮屬質或二元變數, 即問項的反應只考慮
(是/否),問題就簡單很多。而且這樣的資料, 也是調查中
常見的....對二元變數, 通常把我們想探討的一類以 "1"
表示, 另一類就以 "0" 表示。
假設 n=1000, 回覆率 90%。令 p1 代表回覆者反應 "1"
的樣本比例, p0 為未回覆者若回覆其反應 "1" 的機率。
如果100%回覆, 在上列設定下全樣本反應 "1" 的比例是:
p = 0.9*p1 + 0.1*p0 = p1 + 0.1*(p0-p1)
以 p1 估計與以 p 估計比較, 偏誤為 (假設全樣本不偏)
bias = p1 - p = 0.1*(p1-p0)
一般, 回覆率是 r 時,
p = p1 + (1-r)*(p0-p1)
而以回覆者實際反應 "1" 比例 p1 估計的偏誤是
bias = p1 - p = (1-r)*(p1-p0)
回覆率達 90% 這樣高標準時, p1 與 p0 即使有 20 百分
點的差距, 對總估計的影響也只有 2 個百分點。 但同樣
假設回覆者與未回覆者反應 "1" 比例差距 20 個百分點,
當回覆率 70% 時, 偏誤達 6 個百分點, 這樣的偏誤已不
算小! 而若回覆率僅 50% 時, 偏誤可達 10 個百分點!
假設某問項 p1=.70 而 p0 在 .50 至 .80 之間, 則全樣
本比例 p = p1 + (1-r)*(p0-p1), 當回覆率 r=90% 時,
其值在 .68 至 .71 之間。當 n=1000 時, 計算群體比
例π的 95% 近似信賴區間得
(.68-1.96*sqrt{.68*.32/1000},
.71+1.96*sqrt{.71*.29/1000})
= (.68-.0289, .71+.0281) = (.651, .738)
假設回覆率由 90% 降為70%, 但反應差幅維持不變, 則全
樣本比例 p 在 .64 到 .73 之間。故 95% 信賴水準之信
賴區間為
(.64-.0298, .73+.0285) = (.610, .758)
若回覆率只有 50%, 同樣的反應差幅, 則全樣本比例 .60
到 .75。故, 95% 水準之信賴區間為
(.60-.0304, .75+.0268) = (.570, .777)
這樣的區間是否可接受?(注意這個區間的寬度並不能以提
高樣本數做有效縮減!)未回覆者與回覆者的反應差距可能
比這裡假設的大或小?(我們無法獲得未回覆者的可能回應,
能保証回覆者與未回覆者之間的反應差距夠小嗎?)
如果反應 "1" 和 "0" 的回覆率有很大差異, 則低回覆率
暗示調查結果將會有很大的相對偏誤。...設反應 "1" 與
"0" 的回覆率分別是 r1 與 r0。
回頭來看中等水準的π值, 假設π=0.4。則 n=1000 得到
的 p 有大約 95% 的機會介於 0.370 和 0.430 之間。我
們仍假設 p 等於中心值 0.4。則: r=.4*r1+.6*r0,
總回覆率 90% 時,
r1 最低 75%, r0 最高 100%, p1=.4*.75/.9=.333
r1 最高 100%, r0 最低 83.3%, p1=.4/.9=.444
r0=95% 時 r1=82.5%, 此時 p1=.33/.9 = .367
r1=95% 時 r0=86.7%, 得 p1=.38/.9=.422
此時根據回覆樣本的反應做推論, 偏誤大概可被容忍。若
總回覆率是 70%, 則
r1 最低 25%, r0 最高 100%, p1=.4*.25/.7=.143
r1 最高 100%, r0 最低 50%, p1=.4/.7=.571
r0=95% 時 r1=32.5%, 此時 p1=.13/.7 = .186
r1=95% 時 r0=53.3%, 得 p1=.38/.7=.543
r0=90% 時 r1=40%, p1=.16/.7=.229
r1=90% 時 r0=56.7%, p1=.36/.7=.514
即使限定兩種反應回覆率各不超過 90%, 回覆樣本與全樣
本之反應 "1" 的比例仍有極大的差距! 由此可以推知:若
總回覆率降至 50%, 回覆樣本很容易就會發生高偏誤! 而
這種高偏誤, 與前文直接假設回覆者與未回覆者之間的反
應差距設定相比, 前文的假設顯然過於保守而致低估偏誤!
統計人員很強調取得的樣本是否具代表性。立意選樣固然
不被排斥, 但極少見到統計學者討論。蓋因既非隨機樣本,
其樣本代表性缺乏理論論証基礎。至於非嚴謹立意或判斷
的主觀樣本, 或隨意找人湊數而已的便利樣本, 學習統計
的人大概沒有人可能接受!
然而即使在抽樣時做得很好, 是完全符合代表性要求的隨
機樣本; 若在執行調查階段不做好嚴格控管, 結果仍可能
一塌糊塗, 完全不可信。
抽樣調查回覆率對結果的影響就像我們欠缺重要控制變數
資料因而無法正確評估。如果我們對所研究的現象已經瞭
如指掌, 則無所謂; 但就因為有許多未知的, 所以需要做
調查。 因此, 除了嚴格要求高問卷回收/問項回覆率, 我
們還有甚麼辦法保証調查結果的可信度?
--
來自統計專業的召喚...
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海