→ andrew43: 預測值唯有自變數範圍且相關性皆與原始資料相仿才會準 12/03 14:06
推 rebe212296: 請搜尋張翔老師的共線性診斷影片 12/03 14:27
→ rebe212296: 自變量有幾個就有幾個迴歸係數 12/03 14:28
推 west1996: 1. 既然x間可替換,yhat值自然會算出同樣的數,所以可以 12/03 14:36
→ west1996: 用 12/03 14:36
→ west1996: 2. rsquare公式只與y跟yhat有關,與bets無關,所以可用 12/03 14:36
謝謝樓上諸位的回答
※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 12/06/2020 10:16:30
→ locka: 借題想問:所謂兩個自變數高度相關,聽起來是其中一個變數 12/07 08:32
→ locka: 對y的解釋性可以大部分由另一個變數代替(也就是第2個變數對 12/07 08:32
→ locka: y的解釋性有限),那這個時候放第2個變數不是增加複雜度嗎? 12/07 08:32
→ locka: 想問這情況下判斷要不要留第二個變數的準則是什麼呢? 12/07 08:32
推 west1996: 看建模目的而定,沒有標準答案 12/08 00:02
推 iphone2003: 應該要先確認「可用」的意思是什麼?共線性發生時,X 12/08 15:15
→ iphone2003: ’X接近nonsingular,因此beta估計量跟yhat的variance 12/08 15:15
→ iphone2003: 會很大 12/08 15:15
推 ee012345: 高度共線性的時候,beta估計的變異很大,但y的變異沒差 12/13 10:04
→ ee012345: 所以如果只是預測(y)的話沒問題,但模型(beta)不好解釋 12/13 10:06
→ ee012345: 至於要保留哪個變數是模式選擇的問題 12/13 10:07
→ ee012345: 有人會選讓Rsquare最低的,也有人取平均直接取代他們 12/13 10:08