精華區beta PublicAffair 關於我們 聯絡資訊
聽說最近在流行統計學 小弟不才也念過一點統計學 來獻醜一下 如有錯誤大家莫見笑 樣本統計(sample statistics) TVBS的出口民調取樣為隨機一萬三千多份 取中位數 n=13500 結果藍綠比為 53:47 也就是 p = 0.47 q = 0.53 假設一: 假設進行出口民調的投票所具有抽樣代表性 而出口民調受訪者將投給誰據實告知民調人員 且拒訪民眾藍綠支持度近似於樣本的支持率 我們來做母體的推論 若一號的得票率要比二號來得高 也就是 虛無假設(null hypotheses) H0 :P = 0.50 顯著假設(alternative hypotheses) Ha :P > 0.50 這時候的臨界 Z值為 Zc = (p-P) / (p*q/n)^0.5 (分子為 p 減 P,分母為 p 乘以 q 除以 n 再開根號) Zc = (0.47-0.5) / (0.47*0.53/13500)^0.5 Zc = -6.98 (這邊有沒有負號其實都一樣) 也就是說如果抽樣具有代表性時 綠贏藍的機率必須要抽樣偏差將近七個標準差 來看發生的機率: P (Z > 1)=0.1587 P (Z > 2)=0.0228 P (Z > 3)=0.0013 P (Z > 4)=0.00003 P (Z > 5)=0.0000003 ...... P (Z > 6.98)=0.000000000........... 在此條件之下綠贏藍的機會 幾乎會等於零 所以這是有人質疑這次選舉的理由之一,為藍營何民調領先,但還是敗選 但是 重點來了 我們來看母體參數 母體參數(population parameters) 總統大選有效票 N= 12,914,422 一號得票 6,471,970 二號得票 6,442,452 一號得票率 P=0.50114 二號得票率 Q=0.49886 由母體參數我們發現民調的抽樣調查結果偏差了 Z= (p-P) / (P*Q/n)^0.5 = 7.24 偏移了 7.24個標準差 得到如此的抽樣結果幾乎是不可能,所以假設要被推翻 也就是說抽樣時發生三種可能 1.抽樣不具代表性 (南綠北藍,但抽樣時北部投票所樣本多於南部投票所樣本) 2.拒答民眾中投給一號的比例高於投給二號 (當南部拒答率高於北部拒答率也會導致此種結果) 3.受訪民眾欺騙民調人員 (我投阿扁,但我告訴你我投給連宋) 當然另外也還有一種可能,就是 4.抽樣樣本沒問題,但發生作票 四種可能性中到底是發生了哪一種 我想因個人立場不同自然有不同解讀 不過我相信發生1,2種情況的機率會是比較高的 同樣的結果也可以解釋歷次選舉中 國民黨說自己民調領先 但最後又敗選的情況 要不就是自己膨風發佈不公正的民調 要不就是太兩光把民調都亂亂做 此為原PO 轉載請註名出處 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.217.108
Amicelli:真難= ="看不懂~"~ 推 134.208.44.101 03/25
jerryoya:真的太難@@" 難怪一堆人被民調唬假的 推 221.169.98.161 03/25
KayJ:推! 理性不是用喊的.. 這樣才是.. 推 140.112.41.172 03/25
deepJason:記得TVBS開票時說53:47但是不公佈誰是53.. 推 61.231.4.211 03/25
qhair:出口民調不具隨機性吧,零分 推 210.85.10.132 03/25