作者Roveren (愛睏)
看板a-bian
標題[討論] 關於出口民調的統計推論
時間Thu Mar 25 01:44:50 2004
聽說最近在流行統計學
小弟不才也念過一點統計學
來獻醜一下
如有錯誤大家莫見笑
樣本統計(sample statistics)
TVBS的出口民調取樣為隨機一萬三千多份
取中位數 n=13500
結果藍綠比為 53:47
也就是 p = 0.47
q = 0.53
假設一:
假設進行出口民調的投票所具有抽樣代表性
而出口民調受訪者將投給誰據實告知民調人員
且拒訪民眾藍綠支持度近似於樣本的支持率
我們來做母體的推論
若一號的得票率要比二號來得高
也就是
虛無假設(null hypotheses) H0 :P = 0.50
顯著假設(alternative hypotheses) Ha :P > 0.50
這時候的臨界 Z值為 Zc = (p-P) / (p*q/n)^0.5
(分子為 p 減 P,分母為 p 乘以 q 除以 n 再開根號)
Zc = (0.47-0.5) / (0.47*0.53/13500)^0.5
Zc = -6.98 (這邊有沒有負號其實都一樣)
也就是說如果抽樣具有代表性時
綠贏藍的機率必須要抽樣偏差將近七個標準差
來看發生的機率:
P (Z > 1)=0.1587
P (Z > 2)=0.0228
P (Z > 3)=0.0013
P (Z > 4)=0.00003
P (Z > 5)=0.0000003
......
P (Z > 6.98)=0.000000000...........
在此條件之下綠贏藍的機會 幾乎會等於零
所以這是有人質疑這次選舉的理由之一,為藍營何民調領先,但還是敗選
但是 重點來了
我們來看母體參數
母體參數(population parameters)
總統大選有效票 N= 12,914,422
一號得票 6,471,970
二號得票 6,442,452
一號得票率 P=0.50114
二號得票率 Q=0.49886
由母體參數我們發現民調的抽樣調查結果偏差了 Z= (p-P) / (P*Q/n)^0.5 = 7.24
偏移了 7.24個標準差
得到如此的抽樣結果幾乎是不可能,所以假設要被推翻
也就是說抽樣時發生三種可能
1.抽樣不具代表性
(南綠北藍,但抽樣時北部投票所樣本多於南部投票所樣本)
2.拒答民眾中投給一號的比例高於投給二號
(當南部拒答率高於北部拒答率也會導致此種結果)
3.受訪民眾欺騙民調人員
(我投阿扁,但我告訴你我投給連宋)
當然另外也還有一種可能,就是
4.抽樣樣本沒問題,但發生作票
四種可能性中到底是發生了哪一種
我想因個人立場不同自然有不同解讀
不過我相信發生1,2種情況的機率會是比較高的
同樣的結果也可以解釋歷次選舉中
國民黨說自己民調領先
但最後又敗選的情況
要不就是自己膨風發佈不公正的民調
要不就是太兩光把民調都亂亂做
此為原PO 轉載請註名出處 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.217.108
→ Amicelli:真難= ="看不懂~"~ 推 134.208.44.101 03/25
→ jerryoya:真的太難@@" 難怪一堆人被民調唬假的 推 221.169.98.161 03/25
→ KayJ:推! 理性不是用喊的.. 這樣才是.. 推 140.112.41.172 03/25
→ deepJason:記得TVBS開票時說53:47但是不公佈誰是53.. 推 61.231.4.211 03/25
→ qhair:出口民調不具隨機性吧,零分 推 210.85.10.132 03/25