[問題] 共線性情況下的判定係數有參考性嗎

作者jasonhsu14 (14號星期五的傑森)

看板Statistics

標題[問題] 共線性情況下的判定係數有參考性嗎

時間Thu Dec 3 12:56:11 2020

各位前輩好小弟這邊有個複迴歸的共線性問題想請教一下就是我的自變量有兩個，但這兩個自變量本身是高度相關那在"完全不處理共線性"的情況下我的第一個問題是我這樣跑迴歸跑出來的迴歸參數估計值beta，對於我輸入不同的自變量所預測到的依變量Y 這樣情況下的Y，是否適合採納? 第二個問題是若上述的Y適合採納的情況下，那這條回歸方程式的判定係數R平方，是否還有參考性以上兩個問題，還麻煩版友們協助也先謝謝願意耐心看到此段落並了解我問題的版友們 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.23.231 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1606971373.A.765.html

→ andrew43: 預測值唯有自變數範圍且相關性皆與原始資料相仿才會準 12/03 14:06

推 rebe212296: 請搜尋張翔老師的共線性診斷影片 12/03 14:27

→ rebe212296: 自變量有幾個就有幾個迴歸係數 12/03 14:28

推 west1996: 1. 既然x間可替換，yhat值自然會算出同樣的數，所以可以 12/03 14:36

→ west1996: 用 12/03 14:36

→ west1996: 2. rsquare公式只與y跟yhat有關，與bets無關，所以可用 12/03 14:36

謝謝樓上諸位的回答 ※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 12/06/2020 10:16:30

→ locka: 借題想問：所謂兩個自變數高度相關，聽起來是其中一個變數 12/07 08:32

→ locka: 對y的解釋性可以大部分由另一個變數代替(也就是第2個變數對 12/07 08:32

→ locka: y的解釋性有限)，那這個時候放第2個變數不是增加複雜度嗎？ 12/07 08:32

→ locka: 想問這情況下判斷要不要留第二個變數的準則是什麼呢？ 12/07 08:32

推 west1996: 看建模目的而定，沒有標準答案 12/08 00:02

推 iphone2003: 應該要先確認「可用」的意思是什麼？共線性發生時，X 12/08 15:15

→ iphone2003: ’X接近nonsingular，因此beta估計量跟yhat的variance 12/08 15:15

→ iphone2003: 會很大 12/08 15:15

推 ee012345: 高度共線性的時候，beta估計的變異很大，但y的變異沒差 12/13 10:04

→ ee012345: 所以如果只是預測(y)的話沒問題，但模型(beta)不好解釋 12/13 10:06

→ ee012345: 至於要保留哪個變數是模式選擇的問題 12/13 10:07

→ ee012345: 有人會選讓Rsquare最低的，也有人取平均直接取代他們 12/13 10:08