Re: 真是傻眼的民調...

作者waynedd (加西莫多)

看板media-chaos

標題Re: 真是傻眼的民調...

時間Thu Aug 16 17:50:11 2007

※ 引述《nightcatman (夜貓)》之銘言： : ※ 引述《waynedd (加西莫多)》之銘言： : : 如果替代樣本不會造成任何失真的話，為何需要「追求降低拒訪率的種種方 : : 法」？能夠斷定這個統計結果是錯，是因為原樣本被替代後，他可能會符合 : : 「信心水準95% (或任一百分比)，抽樣誤差正負3%(或任一百分比)」這個前 : : 提下嗎？ : 你又在打稻草人了 : 我說的是, 替代樣本"不一定"會造成任何失真 : 所以我不會去否定追求降低拒訪率的方法 : 但是你仍舊 "無法用30%左右的拒訪率就完全否定某個統計結果" : 因為失真和不失真的可能性同時存在 : 另外我不知道你扯信心水準和抽樣誤差幹嘛? : 如果替代樣本的分佈無bias,信心水準和抽樣誤差就都不會降 : 而你在母體分佈未知的狀況下 : 如何能得知替代樣本的分佈"一定"會有bias? 所以請問你的「如果替代樣本的分佈無bias」的假設如何成立？ : : 如果我說的是經驗性的原則，你自己所說的呢？其實比我更大膽，這是一個 : : 「假設性」，「假設」了「不在家的人所支持政黨的分佈和母體並無差異」 : : ，因此推論出「不管換幾次樣本，替代樣本都不可能會造成誤差」，就你自 : : 己也承認的，誰都不知道母體長什麼樣子，請問你的假設有辦法證明成立嗎 : 你沒有看懂我說的話,不然就是你在刻意扭曲 : 我之所以會說 "如果不在家的人所支持政黨的分佈和母體並無差異" 這件事 : 是要表示 "不在家的人所支持政黨的分佈" : 同時具有 "與母體分佈無差異" 和 "與母體分佈有差異" 的可能性 : 而並不是說 "與母體分佈一定無差異" : 所以我一直在說, 你並沒有看清楚我的statement和argument : 我並不需要去證明什麼 : 兩者同時存在的可能性就是全集合,這是自然成立的,無需證明 : 你要去否定其中一種可能性,才需要去證明 : 而且這個證明無法用舉例的方式成立 : 我以為這是很基本的邏輯 = = 我要問的是你的「如果」怎麼成立？在無法證明之前，這會被認為兩者都應該會存在，但是經過「雷根事件(研究)」後，已經否定了另一個可能性，也就是「如果不在家的人XXXX的分佈和母體並無差異」的可能，當你顧及某一因素，又能顧及例如男女比與母題無差異、年領分布與母體無差異等等眾多因素。被否定前是無法判斷何者會成立，但以「雷根事件(研究)」後，發現原樣本被替代會造成結果的誤差。所以若以「分布」一詞就認為代表含有數學理論，那一個事件的說明又豈不能說是含有「無數的數學理論」？ : : ？這個問題相信在「雷根事件」前有被討論過，而「雷根事件」後發現，「 : : 假設不在家的人所支持政黨的分佈和母體並無差異」是不成立的，反而需要 : : 追原本所抽出的樣本，所獲得的結果才是正確的。 : 並不是 : 它在這個案例裏不成立 : 是因為有個"共和黨員經常在家"的隱性bias存在 : 而你無法證明這樣的bias在所有的案例中都存在 : (請注意,再一次強調 : 我說的是bias可能存在也可能不存在,而不是否定其中一種可能性) : 而我上篇也說過 : 你可以說這樣的bias在實務案例中經常會出現 : 那ok, 因為這是經驗性敘述 : 這些在上篇都講過了 = = 「雷根事件」中的bias是「某方選民不常在家」，「文學文摘」中的bias是「某方選民比較不回郵」，聯合報的bias是「某方選民比較不回答」，每次因素都不同，但這真的只是這樣看似單一且獨立而已？這些都可以歸納出是「未回應」樣本，所以在「雷根事件」中「未回應」而存在的bias，有沒有出現在「文學文摘」中？有沒有出現在聯合報的民調中？研究方法有演繹法跟歸納法，我以為這是最基本應該都會的。 : : 所以不管樣本被替代的理由是什麼，「雷根事件」的原理在於：「依照統計 : : 方法所抽出的樣本是具有代表性，遭到替代後會造成樣本結構高於原先所設 : : 定的誤差」。所以要我承認「替代樣本就是有不具bias的可能性」，那請先 : : 證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」先成立再 : : 說。 : 再說一次 : 替代樣本如果不具bias,那麼被替代後的樣本結構根本就不會有任何改變 : 也不會增加抽樣誤差 : 而在母體分佈未知的狀況下,你無從證明替代樣本一定會具有bias : 所以你無法單從30%拒訪率否定某個統計結果 : 這是一整個連帶的觀念 : 而重點就是 "你無從證明替代樣本一定會具有bias" : 如上段所述,具有bias和不具有bias的可能性都是存在的 : 你要否定其中一個, 就要去證明它確實能完全被否定 : 而這無法透過舉例的方法得證從具可檢驗的選舉民調研究中就可以證明，只是你一再排除這些已經被實證的資料，繼續用虛渺的「可能會可能不會」來回答，以案例帶出一整個觀念，但是卻每每用「無法透過舉例的方法得證」閃避，對於曾有過的研究結果視而不見。 : : 以上別跟我說你沒假設，因為你用了「如果」的字眼。 : 我用如果是要表達替代樣本確實有不具bias的可能性 : 如前述 : 請勿刻意扭曲或玩文字遊戲再說一次，請證明「如果」的可能性成立。 : : 「理論上就是不一定會」？你前段的理論上，是建立在一個無法證明其是否 : : 成立的「如果」上。所以，imputation和post-stratification 是建立在一 : : 個「事後用經驗性的假設來補data」，那請問你的「如果」是建立在「什麼 : : 」上的「假設」？ : 你一直在重覆相同的東西... 請參閱上面吧... Orz 你一直不回答所以我只好一直重複。 : : 提imputation和post-stratification 離題？我只想知道如果樣本被替代真 : : 如你所說「理論上就是不一定會」造成誤差，那又何須發展出這些「事後用 : : 經驗性的假設來補data的辦法」？甚至還要冒著「選取的過程極端仰賴經驗 : : ，如果所選的和母體分佈差太多，反而會做出更糟的結果」的風險呢？是那 : : 些研究人員太閒了，無聊玩玩建立模型、寫寫起碼八本重要貢獻的文獻？ : 請參閱本文第一段... Orz : 你真的離題很多 : 這些補missing data的辦法 : 是在於你認為missing data的分佈有bias, 足以影響統計結果的時候 : 用來補正bias用的 : 但這些方法的存在,並不能反證missing data的分佈一定會帶有bias : 這是很明顯的邏輯問題吧 = = : 另外,這些補data的方法確實極端仰賴經驗,不然會越做越糟 : 如果你不相信,可以回去問你的統計老師 : 研究人員為什麼要建模,就是想要找出一個比較好的選取方法來改善這點 : 你提這件事完全無法證明或否定我的那個statement : 所以我才說你離題甚遠... 你真的閱讀能力有夠差，如果你所謂的可能性都能成立，今天幹嘛做這些補救？未回應有bias或無bias都是機率問題，既然是隨機產生，那又何必去補助，反正這次以imputation或post-stratification 補救，說不定反而更糟不是嗎？不補救，說不定這次誤差真的很大。所以，沒辦法確定會有誤差的話，那這麼多專精於imputation或post-stratification 是搞心酸的？ : : 首先，「從這個案例中學習到樣本多不見得是好」，這是解釋文學文摘帶給 : : 大家的省思，但是這是回應的所謂的「舉例無用」論。 : : 話要說的保守？OK！請告訴我樣本被替代後你有多少把握是符合母體分佈？ : : 或者說在1067個樣本數、信心水準 95%、抽樣誤差+-3%下，你有多少把握在 : : 樣本數被替代三分之一後，還符合這樣的信心水準跟抽樣誤差？甚至你有多 : : 少把握「被替代樣本的因素之分佈和母體並無差異」的「假設」是成立的？ : 我不知道母體分佈, 所以未知 : 但重點是, 因為未知, 所以我並沒有主張一定是怎樣 : 主張一定是怎樣的是你, 並不是我 : 所以,再一次的, 你根本搞錯了我的statement : 我說的並不是 "被替代樣本的因素之分佈和母體並無差異" : 而是 "被替代樣本的因素之分佈和母體分佈並不一定有差異" : 所以又是一樣的問題,請看前幾段... Orz 我已經證明過了，用以前的研究結果跟你說會有差異，現在你要顛覆這些研究結果，就是你需要證明，因為你主張一定是「被替代樣本的因素之分佈和母體分佈並不一定有差異」。 : : 以及我是以「別人用來處理常見案例的經驗性原則，誤解為是理論上的必然 : : 」，那你的「被替代樣本的因素之分佈和母體並無差異」又建立在「什麼性 : : 」的「原則」呢？ : : 既然知道「真要嚴謹的講統計，話都要講得很保守才行」，我真的不太曉得 : : 「被替代樣本的因素之分佈和母體並無差異」，此話「保守」了嗎？ : 稻草人again... 請看前幾段... Orz 請回答我前幾段的問題。 : : 所以你了解了樣本被替代的「狀況、條件和限制」了嗎？所以請告訴我「被 : : 替代樣本的因素之分佈和母體並無差異」的數學基礎是什麼？ : 一樣的稻草人又 +1 再一次請回答我前幾段的問題。 : : 社會科學的目的是什麼？就是要「同一個方法做出來，就一定會在同情況下 : : 都做出必然相同的結果」，因此統計方法會說「在1067個樣本數、信心水準 : : 95% 、抽樣誤差+-3%」下，確實訪問到一開始被抽出的樣本，所得的結果是 : : 會一樣的，這些是嚴謹的統計下的「狀況、條件和限制」。 : 如果沒拒訪樣本分佈不存在bias : 結果也會是一樣的 : 這是不是社會科學我不知道,不過這是數學 : 社會科學也許會告訴我們, 根據以往的案例,拒訪樣本分佈通常會有bias : 這樣的經驗性陳述是ok的 : 但你如果要說拒訪樣本分佈"一定"會有bias : 我也就只能說,數學上你沒辦法證明這點以前的研究案例已經證明，但是你都視而不見。 : : 最後，我把幾個問題整理一下，希望能得到你的回答： : : 1.請證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」成立？ : 在本文中一再重覆的稻草人問題 : 我說的是 : "被替代樣本的因素之分佈和母體分佈並不一定有差異" : 請參閱前文現在是要你證明另一個可能性存在。請證明。 : : 2.「被替代樣本的所有因素之分佈和母體並無差異」建立在「什麼性」的「原 : : 則」？ : 同1. 同上。 : : 3.在確實訪問到原本樣本下，可以有把握的說「在1067個樣本數，調查結果有 : : 信心水準95% 、抽樣誤差+-3%的範圍內確實反映母體」，請問在原樣本被替 : : 代三分之一的情況，還有把握結果能在「信心水準95% 、抽樣誤差+-3%的範 : : 圍內確實反映母體」？ : 這也是稻草人 : 我並沒有說它一定能成立 : 我說的是 "你不能說它一定不成立" 現在是要你證明另一個可能性存在。請證明。 : : 4.「『如果』不在家的人所支持政黨的分佈和母體並無差異，那麼你不管換幾 : : 次樣本，替代樣本都不可能會造成誤差」，此句話在你認為「真要嚴謹的講 : : 統計，話都要講得很保守才行」認知下，「保守」嗎？ : 如前文中所述 : 如果你正確理解我舉此例所要表達的意思 : 那麼就可以知道我這段敘述並無任何問題 : 所以, 重點是, 你能不能正確理解我的statement和argument是什麼 : 而不是一直在打稻草人 : 這在11913推文裏我就說過了 Orz : 以上內容希望你先真的好好看完, 想一下 : 不要又急著回文反駁那些我並沒有主張的論點 : 謝謝將模棱兩可的說法回答出來，這當然看似沒有問題，因為你可以這樣解釋，也可以那樣解釋，希望你若想推翻以前研究的結果，那請先好好想一下，該怎麼讓你認為也存在的另一個可能性成立。 -- 手是為了握在一起而存在的不是嗎？ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.119.210.21