精華區beta Statistics 關於我們 聯絡資訊
※ 引述《nextone.bbs@ptt.cc (you got it)》之銘言: : 有人能跟我說多元迴歸分析中的 : hat matrix diagonal elements 考慮簡單直線迴歸的情形: h_i = (1/n) + (x_i-\bar{x})^2/Σ(x_j-\bar{x})^2 可以發現: h_i 代表的是第 i 點的 x 值與中心相距多遠 (除了多一個常數 1/n 以外). 對複迴歸, 其意義也是相同: h_i 愈大, 表示該點就自變 數所處位置而言, 離中心較遠. 你可以用兩自變數的情形 驗證之. : studentized deleted residual "deleted residual" 是去掉 "待測點" 後, 配適原模型, 然後計算待測點與根據該估計模型預測結果之離差. 在線 性迴歸模型, 事實上 deleted residual 與普通 residual 有一簡單關係, 即 d_i = e_i/√(1-h_i). 而 studentized deleted residual 是以其標準誤校正結 果, 就像一般的 t 統計量. 因此, 若 studentized deleted residual 絕對值偏高, 表示這點與其他點可能屬不同模型, 即這一點的反應值是 outlier. : cook's Di statistic 若 outlier 發生在 h_i 較大, 也就是離觀測點中心較遠 時, 將扭曲估計結果. 也就是說: 最小平方估計結果會受 這樣的點重大影響, 是所謂 influential point. Cook's D 就是檢測影響點的一個指標. : variance inflationary factor 當解釋變數間相關(複相關)太高時, 即所謂 "多重共線性" 問題. 完全的共線性使迴歸係數的估計發生問題; 不完全 的共線性(高複相關)則使迴歸係數估計結果不穩定 (標準 差或變異數偏高). VIF就是檢查自變數間的相關會造成迴 歸係數估計量的標準差將被擴大成幾倍/ : the Cp statistic 選模的一種指標, 由 "預測誤差" 的想法而來, 是均方預 測誤差與純誤差均方的比. 但因不同數量的解釋變數 Cp 的期望值不同, 因此引發在選模上究竟要取 Cp 最小或取 Cp 最接近期望值的爭議. : 分別是在檢定什麼嗎?我只知公式,但我不 : 了解它們的涵意,就要期末考了>"< : 麻煩各位幫忙一下! : 謝謝 -- 統計專業版需要你! 不論你是統計高手或初學, 是統計專業或應用領域人才, 歡迎光臨! 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) 批踢踢實業站 telnet://ptt.cc Statistics (統計學及統計軟體版) -- Origin:《 成大計中 BBS 站 》[bbs.ncku.edu.tw] 來源:[pc117.stat.ncku.edu.tw]