作者nightcatman (夜貓)
看板media-chaos
標題Re: 真是傻眼的民調...
時間Thu Aug 16 16:50:53 2007
※ 引述《waynedd (加西莫多)》之銘言:
: ※ 引述《nightcatman (夜貓)》之銘言:
: : 在此我再次強調
: : 我在這討論串中對這主題唯一的主張就是
: : "無法用30%左右的拒訪率就完全否定某個統計結果"
: : 請參閱我在11913的推文內容
: : 我並沒有否認追求降低拒訪率的種種方法
: : 也沒有直接斷定這個統計結果是對是錯
: : 所以如之前推文所述
: : 請先確定我們在講的是同一件事
: 如果替代樣本不會造成任何失真的話,為何需要「追求降低拒訪率的種種方
: 法」?能夠斷定這個統計結果是錯,是因為原樣本被替代後,他可能會符合
: 「信心水準95% (或任一百分比),抽樣誤差正負3%(或任一百分比)」這個前
: 提下嗎?
你又在打稻草人了
我說的是, 替代樣本"不一定"會造成任何失真
所以我不會去否定追求降低拒訪率的方法
但是你仍舊 "無法用30%左右的拒訪率就完全否定某個統計結果"
因為失真和不失真的可能性同時存在
另外我不知道你扯信心水準和抽樣誤差幹嘛?
如果替代樣本的分佈無bias,信心水準和抽樣誤差就都不會降
而你在母體分佈未知的狀況下
如何能得知替代樣本的分佈"一定"會有bias?
: : 我想你並沒有正確理解這個事件的原理
: : 這個事件之所以會發生替代樣本有誤差的情況
: : 原因在於 "美國共和黨員較不容易在家" 這個事實
: : 也就是說, 發生替代的原因(不在家)正好帶有能影響結果的bias(共和黨員)
: : 所以你可以很確定的說
: : 在這個例子裏替代樣本確實會造成誤差
: : 但,很顯然的,這樣的bias並不一定會存在於所有的例子裏
: : 以本例而言
: : 如果不在家的人所支持政黨的分佈和母體並無差異
: : 那麼你不管換幾次樣本,替代樣本都不可能會造成誤差
: : 你也許會說,在實作上,這種隱性的bias經常都是存在的
: : 那ok, 因為這是一個經驗性的敘述
: : 你說的那些民調改善辦法,也是基於這種經驗性的原則來發展的
: : 但我要說的是,理論上來說
: : 替代樣本就是有不具bias的可能性,你無法否認
: 如果我說的是經驗性的原則,你自己所說的呢?其實比我更大膽,這是一個
: 「假設性」,「假設」了「不在家的人所支持政黨的分佈和母體並無差異」
: ,因此推論出「不管換幾次樣本,替代樣本都不可能會造成誤差」,就你自
: 己也承認的,誰都不知道母體長什麼樣子,請問你的假設有辦法證明成立嗎
你沒有看懂我說的話,不然就是你在刻意扭曲
我之所以會說 "如果不在家的人所支持政黨的分佈和母體並無差異" 這件事
是要表示 "不在家的人所支持政黨的分佈"
同時具有 "與母體分佈無差異" 和 "與母體分佈有差異" 的可能性
而並不是說 "與母體分佈一定無差異"
所以我一直在說, 你並沒有看清楚我的statement和argument
我並不需要去證明什麼
兩者同時存在的可能性就是全集合,這是自然成立的,無需證明
你要去否定其中一種可能性,才需要去證明
而且這個證明無法用舉例的方式成立
我以為這是很基本的邏輯 = =
: ?這個問題相信在「雷根事件」前有被討論過,而「雷根事件」後發現,「
: 假設不在家的人所支持政黨的分佈和母體並無差異」是不成立的,反而需要
: 追原本所抽出的樣本,所獲得的結果才是正確的。
並不是
它在這個案例裏不成立
是因為有個"共和黨員經常在家"的隱性bias存在
而你無法證明這樣的bias在所有的案例中都存在
(請注意,再一次強調
我說的是bias可能存在也可能不存在,而不是否定其中一種可能性)
而我上篇也說過
你可以說這樣的bias在實務案例中經常會出現
那ok, 因為這是經驗性敘述
這些在上篇都講過了 = =
: 所以不管樣本被替代的理由是什麼,「雷根事件」的原理在於:「依照統計
: 方法所抽出的樣本是具有代表性,遭到替代後會造成樣本結構高於原先所設
: 定的誤差」。所以要我承認「替代樣本就是有不具bias的可能性」,那請先
: 證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」先成立再
: 說。
再說一次
替代樣本如果不具bias,那麼被替代後的樣本結構根本就不會有任何改變
也不會增加抽樣誤差
而在母體分佈未知的狀況下,你無從證明替代樣本一定會具有bias
所以你無法單從30%拒訪率否定某個統計結果
這是一整個連帶的觀念
而重點就是 "你無從證明替代樣本一定會具有bias"
如上段所述,具有bias和不具有bias的可能性都是存在的
你要否定其中一個, 就要去證明它確實能完全被否定
而這無法透過舉例的方法得證
: 以上別跟我說你沒假設,因為你用了「如果」的字眼。
我用如果是要表達替代樣本確實有不具bias的可能性
如前述
請勿刻意扭曲或玩文字遊戲
: : 我前段已回覆
: : 我的答案就是: 理論上就是不一定會
: : 你所說的"一定"是基於經驗法則,並不是數學
: : 數學並不是用舉例來證明的
: : 另外這邊你提到imputation和post-stratification
: : 其實有點離題
: : 這些都是事後用經驗性的假設來補data的辦法
: : 選取某些主要變數當做missing data的分佈
: : 或是選用其他相同調查對象的結果當標準來加權原樣本以補上data
: : 但,選取的過程極端仰賴經驗
: : 如果所選的和母體分佈差太多,反而會做出更糟的結果
: : 但不論如何
: : 提這些補data的方法,都和我想要講的主題
: : "無法用30%左右的拒訪率就完全否定某個統計結果" 離題太多
: : 再次強調
: : 我並沒有要否定使用這些補data的技巧
: : 我只是要說, 30%左右的拒訪率, 你不能說他一定是錯
: : 甚至就算你要補data,也還有越補越差的風險在
: : 並不是有補誤差就一定會降
: 「理論上就是不一定會」?你前段的理論上,是建立在一個無法證明其是否
: 成立的「如果」上。所以,imputation和post-stratification 是建立在一
: 個「事後用經驗性的假設來補data」,那請問你的「如果」是建立在「什麼
: 」上的「假設」?
你一直在重覆相同的東西... 請參閱上面吧... Orz
: 提imputation和post-stratification 離題?我只想知道如果樣本被替代真
: 如你所說「理論上就是不一定會」造成誤差,那又何須發展出這些「事後用
: 經驗性的假設來補data的辦法」?甚至還要冒著「選取的過程極端仰賴經驗
: ,如果所選的和母體分佈差太多,反而會做出更糟的結果」的風險呢?是那
: 些研究人員太閒了,無聊玩玩建立模型、寫寫起碼八本重要貢獻的文獻?
請參閱本文第一段... Orz
你真的離題很多
這些補missing data的辦法
是在於你認為missing data的分佈有bias, 足以影響統計結果的時候
用來補正bias用的
但這些方法的存在,並不能反證missing data的分佈一定會帶有bias
這是很明顯的邏輯問題吧 = =
另外,這些補data的方法確實極端仰賴經驗,不然會越做越糟
如果你不相信,可以回去問你的統計老師
研究人員為什麼要建模,就是想要找出一個比較好的選取方法來改善這點
你提這件事完全無法證明或否定我的那個statement
所以我才說你離題甚遠...
: : 首先, 我從來沒說過 "樣本多就是好", 我只認為"有比較大的可能性是好"
: : 真要嚴謹的講統計,話都要講得很保守才行
: : 我仍舊認為你有錯誤的理解
: : 你把別人用來處理常見案例的經驗性原則
: : 誤解為是理論上的必然
: : 再重覆一次, 話要講得很保守
: : 你得要分清楚"常見"和"一定"的差別所在
: 首先,「從這個案例中學習到樣本多不見得是好」,這是解釋文學文摘帶給
: 大家的省思,但是這是回應的所謂的「舉例無用」論。
: 話要說的保守?OK!請告訴我樣本被替代後你有多少把握是符合母體分佈?
: 或者說在1067個樣本數、信心水準 95%、抽樣誤差+-3%下,你有多少把握在
: 樣本數被替代三分之一後,還符合這樣的信心水準跟抽樣誤差?甚至你有多
: 少把握「被替代樣本的因素之分佈和母體並無差異」的「假設」是成立的?
我不知道母體分佈, 所以未知
但重點是, 因為未知, 所以我並沒有主張一定是怎樣
主張一定是怎樣的是你, 並不是我
所以,再一次的, 你根本搞錯了我的statement
我說的並不是 "被替代樣本的因素之分佈和母體並無差異"
而是 "被替代樣本的因素之分佈和母體分佈並不一定有差異"
所以又是一樣的問題,請看前幾段... Orz
: 以及我是以「別人用來處理常見案例的經驗性原則,誤解為是理論上的必然
: 」,那你的「被替代樣本的因素之分佈和母體並無差異」又建立在「什麼性
: 」的「原則」呢?
: 既然知道「真要嚴謹的講統計,話都要講得很保守才行」,我真的不太曉得
: 「被替代樣本的因素之分佈和母體並無差異」,此話「保守」了嗎?
稻草人again... 請看前幾段... Orz
: : 分佈當然是數學
: : 前人運用數學理論來改善抽樣方法當然也是數學
: : 但是你必須要了解這些改善抽樣方法背後的數學基礎
: : 以及它們適用的狀況,條件,和限制為何
: : 並不是一個方法做出來,就一定會在所有情況下都做出必然的結果
: : 尤其是統計方法,這種情況更常發生
: : 整個討論串下來,我覺得這是你最大的盲點所在
: : 所以我才會說,你對於"演進史"這種事的認知,高於你對於理論本身的認知
: : 以上
: 所以你了解了樣本被替代的「狀況、條件和限制」了嗎?所以請告訴我「被
: 替代樣本的因素之分佈和母體並無差異」的數學基礎是什麼?
一樣的稻草人又 +1
: 社會科學的目的是什麼?就是要「同一個方法做出來,就一定會在同情況下
: 都做出必然相同的結果」,因此統計方法會說「在1067個樣本數、信心水準
: 95% 、抽樣誤差+-3%」下,確實訪問到一開始被抽出的樣本,所得的結果是
: 會一樣的,這些是嚴謹的統計下的「狀況、條件和限制」。
如果拒訪樣本分佈不存在bias
結果也會是一樣的
這是不是社會科學我不知道,不過這是數學
社會科學也許會告訴我們, 根據以往的案例,拒訪樣本分佈通常會有bias
這樣的經驗性陳述是ok的
但你如果要說拒訪樣本分佈"一定"會有bias
我也就只能說,數學上你沒辦法證明這點
: 最後,我把幾個問題整理一下,希望能得到你的回答:
: 1.請證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」成立?
在本文中一再重覆的稻草人問題
我說的是
"被替代樣本的因素之分佈和母體分佈並不一定有差異"
請參閱前文
: 2.「被替代樣本的所有因素之分佈和母體並無差異」建立在「什麼性」的「原
: 則」?
同1.
: 3.在確實訪問到原本樣本下,可以有把握的說「在1067個樣本數,調查結果有
: 信心水準95% 、抽樣誤差+-3%的範圍內確實反映母體」,請問在原樣本被替
: 代三分之一的情況,還有把握結果能在「信心水準95% 、抽樣誤差+-3%的範
: 圍內確實反映母體」?
這也是稻草人
我並沒有說它一定能成立
我說的是 "你不能說它一定不成立"
: 4.「『如果』不在家的人所支持政黨的分佈和母體並無差異,那麼你不管換幾
: 次樣本,替代樣本都不可能會造成誤差」,此句話在你認為「真要嚴謹的講
: 統計,話都要講得很保守才行」認知下,「保守」嗎?
如前文中所述
如果你正確理解我舉此例所要表達的意思
那麼就可以知道我這段敘述並無任何問題
所以, 重點是, 你能不能正確理解我的statement和argument是什麼
而不是一直在打稻草人
這在11913推文裏我就說過了 Orz
以上內容希望你先真的好好看完, 想一下
不要又急著回文反駁那些我並沒有主張的論點
謝謝
--
※ 編輯: nightcatman 來自: 163.1.159.233 (08/16 17:06)
推 fotofolio:乾脆我說你有可能是白癡有可能不是 你就 203.70.192.170 08/16 21:37
→ fotofolio:永遠沒辦法說我說錯 而且我沒有主張你是 203.70.192.170 08/16 21:39
→ fotofolio:白癡 我這真是個完美的statement呀 203.70.192.170 08/16 21:40
推 nightcatman:我有個更棒的statement來自waynedd 163.1.159.233 08/17 03:53
→ nightcatman:由於過去有個白痴在我文章下亂入推文, 163.1.159.233 08/17 03:57
→ nightcatman:所以所有在我文章下亂入推文的人都必 163.1.159.233 08/17 03:58
→ nightcatman:然會是白痴, 這邏輯棒吧 ^^ 163.1.159.233 08/17 03:59