看板 Statistics 關於我們 聯絡資訊
取得一個樣本之後,如果它的變異數小,那麼它的 精確度或者說可靠度比較高。 那如果我們做統計推論,根據樣本算出的信心區間 的寬度比較窄,是否表示估計的平均值落於較窄區 間而更可靠? 或者說,信心區間的寬度有什麼統計 上的意義? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.72.32 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1641959657.A.3B7.html
Pieteacher: 這是要用比較的,兩個不同treatment 的 interval 寬 01/12 17:48
Pieteacher: 度不同但是 coverage probability 一樣,就會選擇窄一 01/12 17:48
Pieteacher: 點的 01/12 17:48
這邊還有個問題是,即使是同一種處置,根據每次抽樣所得的樣本所計算的 信心區間寬度也會不同。換言之這信心區間寬度本身也是隨機變數。 所以問題其實有二,首先最基本的是,抽樣所得信心區間寬度的數值 有什麼統計意義。其二是,怎樣估計這個信心區間寬度?多次抽樣估 計後取平均值嗎? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/12/2022 22:44:14
locka: 關於統計意義,我的理解是:樣本平均值介於上界跟下界之間 01/13 01:37
locka: 的機率(例如在95%的信心水準下,代表算100次的樣本平均值有 01/13 01:37
locka: 95次會在這個區間中)。至於需不需要真的算100次樣本平均然 01/13 01:37
locka: 後再把每一次的上下界平均,取得一個平均的上下界,答案是 01/13 01:37
locka: 不用(應該)。因為只要是對同一個母體做隨機抽樣,則做成對t 01/13 01:37
locka: 檢定應該會發現無法拒絕虛無假說,所以雖然每一次抽樣本算 01/13 01:37
locka: 出來的樣本平均值跟上下界有所變化,但基本上不會相差太多 01/13 01:37
locka: ,所以不用拘泥於每一次算出來的上下界不一樣這件事。(就算 01/13 01:37
locka: 你取上下界的平均好了,也不過就是一個值,而且跟任何一次 01/13 01:37
locka: 抽樣的上下界結果比較也是無法拒絕虛無假說) 01/13 01:37
換言之,每次取樣計算信心區間的意義,僅在於查看該此樣本平均值是否落於 區間內。倘是者則統計顯著,反之則否。 這其實和每次取樣計算 p 值的功用相同,只看該值是否小於顯著水準以判定 是否統計顯著。 這樣看來,每次取樣計算信心區間和計算 p 值的目的和公用完全一致。但是 文獻上有爭執論文應該 1. 給信心區間 2. 給 p 值 3. 給兩者。 其中第一種認為給信心區間「能做出給多統計解釋」。但從上面討論實在看不出。 ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 09:29:44
andrew43: 區間是否包括假設值,和區間的上下界值為何,是解釋不 01/13 11:11
^^^^^^^^^^^^^^^^ 這是假說檢定
andrew43: 同事情。 01/13 11:11
andrew43: 不同在於你傾向假說檢驗還是參數估計。 01/13 11:12
所以是說,如果用樣本計算出信心區間,除了可檢查假設值是否在區間內而 檢定假說,還可進一步從區間寬度判斷樣本參數的可靠度? 例如參數是準確度 ,則其信心區間窄表示這個樣本對該參數的估計比較可靠? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 12:27:18
locka: 感覺好像也不是說比較可靠耶(搔頭),只要是在同樣的信心水 01/13 12:36
locka: 準下,寬或窄都一樣可靠啊。只能說根據抽樣資料的分佈情形 01/13 12:36
locka: ,窄的表示樣本平均值的變異比較小,用來估計母體參數的變 01/13 12:36
locka: 異也比較小,應該是這樣…吧? 01/13 12:36
wieldthewave: 其實我覺得信賴區間可以對統計結果多做解釋是對的, 01/13 14:24
wieldthewave: 畢竟他可以直接對母體平均給出上下界,但pvalue就是 01/13 14:24
wieldthewave: 單純對假設檢定給出有沒有拒絕而已。就是信賴區間除 01/13 14:24
wieldthewave: 了可以看有沒有拒絕之外,也可以再推論一些東西 01/13 14:24
andrew43: 一個民調的95%區間20%+/-3%,這叫估計不叫假說檢定。 01/13 14:34
andrew43: 20%+/-3%不包括25%,因此拒絕H0:theta=25%,這才叫檢定 01/13 14:36
andrew43: 另一個方法對同母體可得95%區間為+/-1%,那叫更可靠。 01/13 14:38
recorriendo: 信賴區間不是母體平均的上下界 95%也不是母體平均 01/13 15:49
recorriendo: 落在這個區間裡的機率! 01/13 15:49
recorriendo: https://doi.org/10.3758/s13423-015-0947-8 01/13 15:56
recorriendo: 這篇的討論看一下吧 你的問題還有上面推文正好就是 01/13 16:01
recorriendo: 他指出的三大fallacies 01/13 16:01
ll6a: 95%就代表Type 1 Error是5%,可靠程度就是95%信賴水準或是5 01/13 17:43
ll6a: %顯著水準,跟寬窄沒關係 01/13 17:43
ll6a: 也不能說跟寬窄沒關係,你信賴水準越高當然也就越寬不過這 01/13 17:50
ll6a: 沒什麼意義,我說你0-200歲一定會死,雖然是一定準但有意義 01/13 17:50
ll6a: 嗎 01/13 17:50
ll6a: 也就是說在大家比較接受的95%信賴水準,寬窄是根據你的隨機 01/13 17:52
ll6a: 誤差大小,但實驗比較care的是你的隨機誤差是否符合線性模 01/13 17:52
ll6a: 型而已 01/13 17:52
意思是: 目標變數 = X (隨機變數) + e (隨機誤差)? 如果誤差是二次或其他函數,目前統計課本的公式不能用?
ll6a: 符合線性模型代表你的實驗因素是有顯著影響,不符合的話你 01/13 18:01
ll6a: 就需要找非實驗因素控制從錯誤的隨機誤差切一塊出來來達成 01/13 18:01
ll6a: 線性模型 01/13 18:01
※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 20:47:12