看板 Math 關於我們 聯絡資訊
※ 引述《alfadick (悟道修行者)》之銘言: : 標題可能寫得很奇怪 XDD 請見諒,為了吸引目光>< : 題目如下: : 某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民佔當地居民之百分比(以下簡 : 稱為「知名度」)。結果如下:在 95% 信心水準之下,該產品在甲、乙兩地的知名度之信 : 賴區間分別為 [ 0.50 , 0.58 ]、[ 0.08 , 0.16 ]。試問下列哪些選項是正確的? : (A) 甲地本次的參訪者中, 54% 的人聽過該產品 依常見的構造比例之信賴區間方法, 這是對的. (就中學課程而言它大概是對的.) 不過, 事實上這不一定是對的. : (B) 此次民調在乙地的參訪人數少於在甲地的參訪人數 如 (A). : (C) 此次調查結果可解讀為:甲地全體居民中有一半以上的人聽過該產品的機率大於 : 95% 甲地居民是否有一半以上的人聽過該產品, 是一個確定但 未知的事, 要論機率的話, 不是0就是1, 但天曉得! 若能 知道就不必再做抽樣調查了. 根據信賴區間 [0.50, 0.58] 可以說 至少有95%信心說甲地至少有一半的人知道該產品. 但再重做一次抽樣調查, 並不能保證95%水準的信賴區間, 其下限仍在0.50以上. : (D) 若在乙地以同樣方式進行多次民調,所得知名度有 95% 的機會落在區間[ 0.08 , : 0.16 ] 即使每次都抽同樣大小的樣本, 而且是幾乎同時做的 (確 保群體未改變), 也難以說有95%,或近似95%的機會落在區 間 [0.08,0.16]. 這敘述有不少錯誤. : (E) 經密集廣告宣傳後,在乙地再次進行民調,並增加參訪人數達原人數的四倍,則在 : 95% 信心水準之下該產品的知名度之信賴區間寬度會減半(即 0.04) 若沒有 "經密集廣告宣傳後", 而是立即重新抽樣,重新調 查, 那麼樣本數增大為4倍, 信賴區間長度減半是對的. 然而, "經密集廣告宣傳後", 群體已經改變了, 群體比例 已改變 (廣告即使不能增加買氣, 至少會提高知名度.) : Ans: A, B : =========================================================== : 翻閱數十本參考書,查閱好幾本學測考題解析,而C選項說法五花八門千奇百怪 : 我熟讀南一、全華課本之後,對於信心水準信賴區間的系統稍有掌握, : 希望與正確的統計學概念互相契合 : (D)選項也是,但是我知道D選項為什麼不對, : 我說說看我的想法,希望能得到大家共鳴,然後再把我對C的想法說出來 : D's Sol: : 因為p hat 有95%的機率在p+-(2sigma)的區間中,我以'表示hat, #表sigma : 也就是 p-2# <= p' <= p+2# (這個關係沒什麼意義) : 即 p-2# <= p' 且 p' <= p+2# : 移項得 p<= p'+2# 且 p'-2# <=p : 所以 p'-2# <= p <= p'+2# (這個式子的價值比較大) : 哦!所以當我抽樣得到p hat 時,真正的p有95%機率在區間p hat +- (2sigma) 當你已得到 p-hat, 就沒有所謂 "機率" 的問題了! 當你有信賴區間[0.08, 0.16], p 是否在其中是確定但未 知的事. "95%水準的信賴區間" 是說在對同一群體重複做抽樣統計 結果, 有95%的機會所計算出來的 "信賴區間" 包含真 p. 此時所談的 "機會"(機率), 是針對不同次抽樣,隨機的結 果,隨機的區間. 而敘述 (D) 卻在說 p-hat 會落在一固定區間的機率. : 但是sigma = sqrt(p(1-p)/n) 其中p我們不知道,但可以p'(hat)來估計 : 所以p', 2#' 都有了,我們可以知道真正的p有95%在這區域裡面,稱為信賴區間 : 回到這個選項: : [0.08,0.16]是這次的p hat加減兩個sigma hat(以sigma hat估計sigma) : 所以題目的敘述,就是在講我說「沒什麼意義」的那關係, : 還沒有到「後面」什麼移項那裡,題目問的是一開始那個很基本的東西! : 也就是題目所說做好幾次抽樣的p hat應該有95%機率落在 : [p-2#,p+2#] 才對,而這個p跟這個sigma都要上帝才能得到! : =================================================== : 但是C選項呢? : (1)有人說不能用機率來講,可是如果題目是要這樣考你,他大可以講=95%, : 何必說大於呢? 她如果只是要考你這個能不能跟機率扯上關係,講等於就好, : 她之所以講大於,一定是有什麼意義 : (2) 可是我認為是這樣 : http://img4.imageshack.us/i/yosh.png/ : 在這p的常態分配中(正中間是p hat , 我已經移項了) : p有95%機率在 [0.50,0.58] 但是常態分配+2#'的右邊還有資料分布, : 我的意思是,p界於0.5~0.58的機率是95%,可是0.58後面還有2.5%的分布 : 所以機率是大於95%,似乎也沒錯,應該是95+2.5=97.5% 左右才對 : 這樣解釋得通,看起來也沒錯, : 請教各位先進前輩,希望有人能順便幫我轉統計版 。 : 謝謝大家耐心看完我的問題 :) 別想太多, 基本觀念很簡單: "信賴水準" 與 "機率"(覆蓋機率)當然是有關的. 更明確 地說, 信賴水準是依存於覆蓋機率的. 而其細節: (1) 一次特定調查結果(一個特定信賴區間)是不能談機率 的. 因為, 所有的東西都是確定(但可能未知)的. 計 算出來的信賴區間(樣本結果)是確定而已知的, 而群 體參數是確定而未知的. (2) 機率是針對抽樣的理論結果, 或無數次重複抽樣的結 果在談的. 因此, 能談 "機率" 的 "信賴區間" 是隨 機的區間. (3) 信賴區間談的是群體的未知參數會落在甚麼範圍, 而 不是樣本統計量(估訐量)或明確的樣本值(估計值)會 落在哪裡. -- 來自統計專業的召喚... 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) <<<>>> 把自己當成別人。把別人當成自己。把別人當成別人。把自己當成自己 <<<>>> -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.233.154.253
haolihy :推 01/16 11:54
qpzmm :推 01/16 18:59