看板 media-chaos 關於我們 聯絡資訊
※ 引述《nightcatman (夜貓)》之銘言: : ※ 引述《waynedd (加西莫多)》之銘言: : : 如果替代樣本不會造成任何失真的話,為何需要「追求降低拒訪率的種種方 : : 法」?能夠斷定這個統計結果是錯,是因為原樣本被替代後,他可能會符合 : : 「信心水準95% (或任一百分比),抽樣誤差正負3%(或任一百分比)」這個前 : : 提下嗎? : 你又在打稻草人了 : 我說的是, 替代樣本"不一定"會造成任何失真 : 所以我不會去否定追求降低拒訪率的方法 : 但是你仍舊 "無法用30%左右的拒訪率就完全否定某個統計結果" : 因為失真和不失真的可能性同時存在 : 另外我不知道你扯信心水準和抽樣誤差幹嘛? : 如果替代樣本的分佈無bias,信心水準和抽樣誤差就都不會降 : 而你在母體分佈未知的狀況下 : 如何能得知替代樣本的分佈"一定"會有bias? 所以請問你的「如果替代樣本的分佈無bias」的假設如何成立? : : 如果我說的是經驗性的原則,你自己所說的呢?其實比我更大膽,這是一個 : : 「假設性」,「假設」了「不在家的人所支持政黨的分佈和母體並無差異」 : : ,因此推論出「不管換幾次樣本,替代樣本都不可能會造成誤差」,就你自 : : 己也承認的,誰都不知道母體長什麼樣子,請問你的假設有辦法證明成立嗎 : 你沒有看懂我說的話,不然就是你在刻意扭曲 : 我之所以會說 "如果不在家的人所支持政黨的分佈和母體並無差異" 這件事 : 是要表示 "不在家的人所支持政黨的分佈" : 同時具有 "與母體分佈無差異" 和 "與母體分佈有差異" 的可能性 : 而並不是說 "與母體分佈一定無差異" : 所以我一直在說, 你並沒有看清楚我的statement和argument : 我並不需要去證明什麼 : 兩者同時存在的可能性就是全集合,這是自然成立的,無需證明 : 你要去否定其中一種可能性,才需要去證明 : 而且這個證明無法用舉例的方式成立 : 我以為這是很基本的邏輯 = = 我要問的是你的「如果」怎麼成立?在無法證明之前,這會被認為兩者都應 該會存在,但是經過「雷根事件(研究)」後,已經否定了另一個可能性,也 就是「如果不在家的人XXXX的分佈和母體並無差異」的可能,當你顧及某一 因素,又能顧及例如男女比與母題無差異、年領分布與母體無差異等等眾多 因素。 被否定前是無法判斷何者會成立,但以「雷根事件(研究)」後,發現原樣本 被替代會造成結果的誤差。所以若以「分布」一詞就認為代表含有數學理論 ,那一個事件的說明又豈不能說是含有「無數的數學理論」? : : ?這個問題相信在「雷根事件」前有被討論過,而「雷根事件」後發現,「 : : 假設不在家的人所支持政黨的分佈和母體並無差異」是不成立的,反而需要 : : 追原本所抽出的樣本,所獲得的結果才是正確的。 : 並不是 : 它在這個案例裏不成立 : 是因為有個"共和黨員經常在家"的隱性bias存在 : 而你無法證明這樣的bias在所有的案例中都存在 : (請注意,再一次強調 : 我說的是bias可能存在也可能不存在,而不是否定其中一種可能性) : 而我上篇也說過 : 你可以說這樣的bias在實務案例中經常會出現 : 那ok, 因為這是經驗性敘述 : 這些在上篇都講過了 = = 「雷根事件」中的bias是「某方選民不常在家」,「文學文摘」中的bias是 「某方選民比較不回郵」,聯合報的bias是「某方選民比較不回答」,每次 因素都不同,但這真的只是這樣看似單一且獨立而已?這些都可以歸納出是 「未回應」樣本,所以在「雷根事件」中「未回應」而存在的bias,有沒有 出現在「文學文摘」中?有沒有出現在聯合報的民調中? 研究方法有演繹法跟歸納法,我以為這是最基本應該都會的。 : : 所以不管樣本被替代的理由是什麼,「雷根事件」的原理在於:「依照統計 : : 方法所抽出的樣本是具有代表性,遭到替代後會造成樣本結構高於原先所設 : : 定的誤差」。所以要我承認「替代樣本就是有不具bias的可能性」,那請先 : : 證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」先成立再 : : 說。 : 再說一次 : 替代樣本如果不具bias,那麼被替代後的樣本結構根本就不會有任何改變 : 也不會增加抽樣誤差 : 而在母體分佈未知的狀況下,你無從證明替代樣本一定會具有bias : 所以你無法單從30%拒訪率否定某個統計結果 : 這是一整個連帶的觀念 : 而重點就是 "你無從證明替代樣本一定會具有bias" : 如上段所述,具有bias和不具有bias的可能性都是存在的 : 你要否定其中一個, 就要去證明它確實能完全被否定 : 而這無法透過舉例的方法得證 從具可檢驗的選舉民調研究中就可以證明,只是你一再排除這些已經被實證 的資料,繼續用虛渺的「可能會可能不會」來回答,以案例帶出一整個觀念 ,但是卻每每用「無法透過舉例的方法得證」閃避,對於曾有過的研究結果 視而不見。 : : 以上別跟我說你沒假設,因為你用了「如果」的字眼。 : 我用如果是要表達替代樣本確實有不具bias的可能性 : 如前述 : 請勿刻意扭曲或玩文字遊戲 再說一次,請證明「如果」的可能性成立。 : : 「理論上就是不一定會」?你前段的理論上,是建立在一個無法證明其是否 : : 成立的「如果」上。所以,imputation和post-stratification 是建立在一 : : 個「事後用經驗性的假設來補data」,那請問你的「如果」是建立在「什麼 : : 」上的「假設」? : 你一直在重覆相同的東西... 請參閱上面吧... Orz 你一直不回答所以我只好一直重複。 : : 提imputation和post-stratification 離題?我只想知道如果樣本被替代真 : : 如你所說「理論上就是不一定會」造成誤差,那又何須發展出這些「事後用 : : 經驗性的假設來補data的辦法」?甚至還要冒著「選取的過程極端仰賴經驗 : : ,如果所選的和母體分佈差太多,反而會做出更糟的結果」的風險呢?是那 : : 些研究人員太閒了,無聊玩玩建立模型、寫寫起碼八本重要貢獻的文獻? : 請參閱本文第一段... Orz : 你真的離題很多 : 這些補missing data的辦法 : 是在於你認為missing data的分佈有bias, 足以影響統計結果的時候 : 用來補正bias用的 : 但這些方法的存在,並不能反證missing data的分佈一定會帶有bias : 這是很明顯的邏輯問題吧 = = : 另外,這些補data的方法確實極端仰賴經驗,不然會越做越糟 : 如果你不相信,可以回去問你的統計老師 : 研究人員為什麼要建模,就是想要找出一個比較好的選取方法來改善這點 : 你提這件事完全無法證明或否定我的那個statement : 所以我才說你離題甚遠... 你真的閱讀能力有夠差,如果你所謂的可能性都能成立,今天幹嘛做這些補 救?未回應有bias或無bias都是機率問題,既然是隨機產生,那又何必去補 助,反正這次以imputation或post-stratification 補救,說不定反而更糟 不是嗎?不補救,說不定這次誤差真的很大。所以,沒辦法確定會有誤差的 話,那這麼多專精於imputation或post-stratification 是搞心酸的? : : 首先,「從這個案例中學習到樣本多不見得是好」,這是解釋文學文摘帶給 : : 大家的省思,但是這是回應的所謂的「舉例無用」論。 : : 話要說的保守?OK!請告訴我樣本被替代後你有多少把握是符合母體分佈? : : 或者說在1067個樣本數、信心水準 95%、抽樣誤差+-3%下,你有多少把握在 : : 樣本數被替代三分之一後,還符合這樣的信心水準跟抽樣誤差?甚至你有多 : : 少把握「被替代樣本的因素之分佈和母體並無差異」的「假設」是成立的? : 我不知道母體分佈, 所以未知 : 但重點是, 因為未知, 所以我並沒有主張一定是怎樣 : 主張一定是怎樣的是你, 並不是我 : 所以,再一次的, 你根本搞錯了我的statement : 我說的並不是 "被替代樣本的因素之分佈和母體並無差異" : 而是 "被替代樣本的因素之分佈和母體分佈並不一定有差異" : 所以又是一樣的問題,請看前幾段... Orz 我已經證明過了,用以前的研究結果跟你說會有差異,現在你要顛覆這些研 究結果,就是你需要證明,因為你主張一定是「被替代樣本的因素之分佈和 母體分佈並不一定有差異」。 : : 以及我是以「別人用來處理常見案例的經驗性原則,誤解為是理論上的必然 : : 」,那你的「被替代樣本的因素之分佈和母體並無差異」又建立在「什麼性 : : 」的「原則」呢? : : 既然知道「真要嚴謹的講統計,話都要講得很保守才行」,我真的不太曉得 : : 「被替代樣本的因素之分佈和母體並無差異」,此話「保守」了嗎? : 稻草人again... 請看前幾段... Orz 請回答我前幾段的問題。 : : 所以你了解了樣本被替代的「狀況、條件和限制」了嗎?所以請告訴我「被 : : 替代樣本的因素之分佈和母體並無差異」的數學基礎是什麼? : 一樣的稻草人又 +1 再一次請回答我前幾段的問題。 : : 社會科學的目的是什麼?就是要「同一個方法做出來,就一定會在同情況下 : : 都做出必然相同的結果」,因此統計方法會說「在1067個樣本數、信心水準 : : 95% 、抽樣誤差+-3%」下,確實訪問到一開始被抽出的樣本,所得的結果是 : : 會一樣的,這些是嚴謹的統計下的「狀況、條件和限制」。 : 如果沒拒訪樣本分佈不存在bias : 結果也會是一樣的 : 這是不是社會科學我不知道,不過這是數學 : 社會科學也許會告訴我們, 根據以往的案例,拒訪樣本分佈通常會有bias : 這樣的經驗性陳述是ok的 : 但你如果要說拒訪樣本分佈"一定"會有bias : 我也就只能說,數學上你沒辦法證明這點 以前的研究案例已經證明,但是你都視而不見。 : : 最後,我把幾個問題整理一下,希望能得到你的回答: : : 1.請證明「被替代樣本的所有因素之分佈和母體並無差異」的「如果」成立? : 在本文中一再重覆的稻草人問題 : 我說的是 : "被替代樣本的因素之分佈和母體分佈並不一定有差異" : 請參閱前文 現在是要你證明另一個可能性存在。請證明。 : : 2.「被替代樣本的所有因素之分佈和母體並無差異」建立在「什麼性」的「原 : : 則」? : 同1. 同上。 : : 3.在確實訪問到原本樣本下,可以有把握的說「在1067個樣本數,調查結果有 : : 信心水準95% 、抽樣誤差+-3%的範圍內確實反映母體」,請問在原樣本被替 : : 代三分之一的情況,還有把握結果能在「信心水準95% 、抽樣誤差+-3%的範 : : 圍內確實反映母體」? : 這也是稻草人 : 我並沒有說它一定能成立 : 我說的是 "你不能說它一定不成立" 現在是要你證明另一個可能性存在。請證明。 : : 4.「『如果』不在家的人所支持政黨的分佈和母體並無差異,那麼你不管換幾 : : 次樣本,替代樣本都不可能會造成誤差」,此句話在你認為「真要嚴謹的講 : : 統計,話都要講得很保守才行」認知下,「保守」嗎? : 如前文中所述 : 如果你正確理解我舉此例所要表達的意思 : 那麼就可以知道我這段敘述並無任何問題 : 所以, 重點是, 你能不能正確理解我的statement和argument是什麼 : 而不是一直在打稻草人 : 這在11913推文裏我就說過了 Orz : 以上內容希望你先真的好好看完, 想一下 : 不要又急著回文反駁那些我並沒有主張的論點 : 謝謝 將模棱兩可的說法回答出來,這當然看似沒有問題,因為你可以這樣解釋, 也可以那樣解釋,希望你若想推翻以前研究的結果,那請先好好想一下,該 怎麼讓你認為也存在的另一個可能性成立。 -- 手是為了握在一起而存在的 不是嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.119.210.21