一定
會有偏差。(P.35)
◎以下都是公式,看了會頭痛的自己跳過〈不想列是因為這裡是媒亂版不是
統計版〉太多特殊符號不太會打,要看的撐著點看。
先將整個抽樣設計看作是分層抽樣
一層是有反應者,或訪問成功者,母體數為N1,樣本數為n1
一層是有反應者,或訪問成功者,母體數為N2,樣本數為n2
母體總數為N = N1+N2 樣本總數為 n = n1+n2
有反應率為W1 = N1/N = n1/n 無反應率為W2 = N2/N = n2/n
假設母體某項特徵的百分比是P_,而所有樣本中具有該項特徵的個案數是 X
,則,^P = X/n,是對母體P_的無偏估計,E(^P) = P_
事實上,因為訪問失敗的情形使我們僅有x1 = x-x2 個具有該項特徵的樣本
,x2是無反應樣本中具有該項特徵的個案數,因訪問失敗而未知。令
^P1 = x1/n1 ^P2 = x2/n2,而
^P = x/n = (x1+x2)/n = n1/n*x1/n1+n2/n*x2/n2 = W1^P1+W2^P2[公式一]
我們知道^P是對母體百分比P_的無偏估計。如果僅用成功樣本的百分比 ^P1
來代替^P,則其差距是
^P1-^P = ^P1-(W1^P1+W2^P2) = (1-W1)^P1-W2^P2 = W2(^P1-^P2)[公式二]
(算式結束,以下是解說)
公式二的數值可以很容易的推論到母體參數的差距上。換句話說,如果僅用
成功樣本的百分比^P1來推論母體百分比,則其偏差E(^P1)-P_可以證明是等
於母體的無反應層比例乘上有反應層中具有該特徵的百分比和無反應層中該
項百分比的差距 W2(P1-P2)。用日常生活語言來看,公式二可以看作是訪問
失敗的代價。如果只用成功樣本來做推論,則所造成的偏差等於失敗率乘上
有反應者和無反應者之間的差異。(P.35-36)
--
手是為了握在一起而存在的
不是嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.229.17.118
※ 編輯: waynedd 來自: 61.229.17.118 (08/16 23:54)
今天我老闆在召喚我了,要我該著重自己的東西,這種落落長的文章我還是
少寫,寫這個太累人了。
擺明了,下面都是偷懶,我直接拿「研究方法」研習營第四期《抽樣調查方
法》的資料節錄寫上:
....調查在對母體進行推論時大都建立在「有效問卷」的基礎上。瞿海源(1
982)和張曉春(1983)曾指出這種推論方式有樣本代表性的顧慮,因為在資料
蒐集過程之中不可避免的一定會發生各式各樣的訪問失敗(nonresponse )問
題使得樣本結構受到扭曲。(P.33)
即使用常識判斷都可以知道如果僅用訪問成功者的資料來對母體做推論