[問題] 變異數和信心區間寬度

作者saltlake (SaltLake)

看板Statistics

標題[問題] 變異數和信心區間寬度

時間Wed Jan 12 11:54:15 2022

取得一個樣本之後，如果它的變異數小，那麼它的精確度或者說可靠度比較高。那如果我們做統計推論，根據樣本算出的信心區間的寬度比較窄，是否表示估計的平均值落於較窄區間而更可靠? 或者說，信心區間的寬度有什麼統計上的意義? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.72.32 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1641959657.A.3B7.html

→ Pieteacher: 這是要用比較的，兩個不同treatment 的 interval 寬 01/12 17:48

→ Pieteacher: 度不同但是 coverage probability 一樣，就會選擇窄一 01/12 17:48

→ Pieteacher: 點的 01/12 17:48

這邊還有個問題是，即使是同一種處置，根據每次抽樣所得的樣本所計算的信心區間寬度也會不同。換言之這信心區間寬度本身也是隨機變數。所以問題其實有二，首先最基本的是，抽樣所得信心區間寬度的數值有什麼統計意義。其二是，怎樣估計這個信心區間寬度？多次抽樣估計後取平均值嗎? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/12/2022 22:44:14

推 locka: 關於統計意義，我的理解是：樣本平均值介於上界跟下界之間 01/13 01:37

→ locka: 的機率(例如在95%的信心水準下，代表算100次的樣本平均值有 01/13 01:37

→ locka: 95次會在這個區間中)。至於需不需要真的算100次樣本平均然 01/13 01:37

→ locka: 後再把每一次的上下界平均，取得一個平均的上下界，答案是 01/13 01:37

→ locka: 不用(應該)。因為只要是對同一個母體做隨機抽樣，則做成對t 01/13 01:37

→ locka: 檢定應該會發現無法拒絕虛無假說，所以雖然每一次抽樣本算 01/13 01:37

→ locka: 出來的樣本平均值跟上下界有所變化，但基本上不會相差太多 01/13 01:37

→ locka: ，所以不用拘泥於每一次算出來的上下界不一樣這件事。(就算 01/13 01:37

→ locka: 你取上下界的平均好了，也不過就是一個值，而且跟任何一次 01/13 01:37

→ locka: 抽樣的上下界結果比較也是無法拒絕虛無假說) 01/13 01:37

換言之，每次取樣計算信心區間的意義，僅在於查看該此樣本平均值是否落於區間內。倘是者則統計顯著，反之則否。這其實和每次取樣計算 p 值的功用相同，只看該值是否小於顯著水準以判定是否統計顯著。這樣看來，每次取樣計算信心區間和計算 p 值的目的和公用完全一致。但是文獻上有爭執論文應該 1. 給信心區間 2. 給 p 值 3. 給兩者。其中第一種認為給信心區間「能做出給多統計解釋」。但從上面討論實在看不出。 ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 09:29:44

→ andrew43: 區間是否包括假設值，和區間的上下界值為何，是解釋不 01/13 11:11

^^^^^^^^^^^^^^^^ 這是假說檢定

→ andrew43: 同事情。 01/13 11:11

→ andrew43: 不同在於你傾向假說檢驗還是參數估計。 01/13 11:12

所以是說，如果用樣本計算出信心區間，除了可檢查假設值是否在區間內而檢定假說，還可進一步從區間寬度判斷樣本參數的可靠度? 例如參數是準確度，則其信心區間窄表示這個樣本對該參數的估計比較可靠? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 12:27:18

→ locka: 感覺好像也不是說比較可靠耶(搔頭)，只要是在同樣的信心水 01/13 12:36

→ locka: 準下，寬或窄都一樣可靠啊。只能說根據抽樣資料的分佈情形 01/13 12:36

→ locka: ，窄的表示樣本平均值的變異比較小，用來估計母體參數的變 01/13 12:36

→ locka: 異也比較小，應該是這樣…吧？ 01/13 12:36

推 wieldthewave: 其實我覺得信賴區間可以對統計結果多做解釋是對的， 01/13 14:24

→ wieldthewave: 畢竟他可以直接對母體平均給出上下界，但pvalue就是 01/13 14:24

→ wieldthewave: 單純對假設檢定給出有沒有拒絕而已。就是信賴區間除 01/13 14:24

→ wieldthewave: 了可以看有沒有拒絕之外，也可以再推論一些東西 01/13 14:24

→ andrew43: 一個民調的95%區間20%+/-3%，這叫估計不叫假說檢定。 01/13 14:34

→ andrew43: 20%+/-3%不包括25%，因此拒絕H0:theta=25%，這才叫檢定 01/13 14:36

→ andrew43: 另一個方法對同母體可得95%區間為+/-1%，那叫更可靠。 01/13 14:38

推 recorriendo: 信賴區間不是母體平均的上下界 95%也不是母體平均 01/13 15:49

→ recorriendo: 落在這個區間裡的機率！ 01/13 15:49

→ recorriendo: https://doi.org/10.3758/s13423-015-0947-8 01/13 15:56

→ recorriendo: 這篇的討論看一下吧你的問題還有上面推文正好就是 01/13 16:01

→ recorriendo: 他指出的三大fallacies 01/13 16:01

推 ll6a: 95%就代表Type 1 Error是5%，可靠程度就是95%信賴水準或是5 01/13 17:43

→ ll6a: %顯著水準，跟寬窄沒關係 01/13 17:43

→ ll6a: 也不能說跟寬窄沒關係，你信賴水準越高當然也就越寬不過這 01/13 17:50

→ ll6a: 沒什麼意義，我說你0-200歲一定會死，雖然是一定準但有意義 01/13 17:50

→ ll6a: 嗎 01/13 17:50

→ ll6a: 也就是說在大家比較接受的95%信賴水準，寬窄是根據你的隨機 01/13 17:52

→ ll6a: 誤差大小，但實驗比較care的是你的隨機誤差是否符合線性模 01/13 17:52

→ ll6a: 型而已 01/13 17:52

意思是: 目標變數 = X (隨機變數) + e (隨機誤差)? 如果誤差是二次或其他函數，目前統計課本的公式不能用?

→ ll6a: 符合線性模型代表你的實驗因素是有顯著影響，不符合的話你 01/13 18:01

→ ll6a: 就需要找非實驗因素控制從錯誤的隨機誤差切一塊出來來達成 01/13 18:01

→ ll6a: 線性模型 01/13 18:01

※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 20:47:12