看板 Statistics 關於我們 聯絡資訊
問題有點多,我先粗略簡單回答。 ※ 引述《Aerisleu (aa)》之銘言: : [軟體程式類別]:SPSS : [程式問題]:多元迴歸的自變項選擇問題 : [軟體熟悉度]:新手 : [問題敘述]: : 我有5個自變項 1個應變項 不確定各個IV跟DV的關係所以先跑相關矩陣 : 線性相關矩陣時IV1跟DV的相關係數0.04 ANOVA表的P-value>0.05 : 但以Compound跑回歸 相關係數就變成0.89 P-value=0.000 : 想請問: : 1. : 因為目標是要建多元迴歸分析 : 在跑線性的時候將IV1加入跟不加入的R^2變化很大 : 是不是應該要把IV1先平方再跑線性多元迴歸 : 這樣是對的方向嗎 「在跑線性的時候將IV1加入跟不加入的R^2變化很大」 這句話只是說IV1對DV的影響可能不小,但,是不是線性關係則不一定。 不過你最前面談到IV1跟DV可能是非線性關係,則確實可以考慮採用二次式, 但至少也要把IV1的一次方也保留。IV1預先中心化也可能是必要的。 你也可以檢視partial residual plot推測各IV對DV在多元迴歸中的表現。 : 相關係數應該要選取大於0.5的再去嘗試排列組合? 通常沒有這條法則。有統計意義的自變數不一定表示它與DV高度相關。 選IV有很多SOP,教科書通常有完整描述。 : 2.比如說IV1跟IV2線性相關係數達0.41 IV2跟DV的相關係數達0.31 : 那麼因為要避免Omitted Vairables Bias IV1跟IV2不適合同時加入多元模型? 0.41並不算高,圖中看來也還好,初步應該不必有這項顧慮。做迴歸診斷時再察查。 : 3.在跑兩兩IV線性的時候 有沒有建議的R^2標準來篩選自變項 : 要不然有時候R^2<0.5 但非線性相關係數超高的 大於0.6 : 這時候該怎麼解釋好呢 (線性迴歸都低) 我不明白你這裡是問怎麼挑IV還是怎麼挑迴歸式的型式。 後者的話,還是畫些partial residual plot看看。 簡單線性迴歸的R2就是二變數的線性相關的平方,留意一下。 這裡說的非線性相關係數實際上是什麼? : 4.大家如何詮釋跑線性迴歸的相關係數與非線性迴歸相關係數差異過大的情況? : 非線性迴歸相關係數 (綠:Compound,橘:Logistic,黃:Quadratic) : https://imgur.com/OfxlIjN : 線性相關係數表 : https://imgur.com/O3nkS5c 這表示IV和DV的關係非常可能是非線性的,例如A和D的關係很不線性。 非線性迴歸相關係數實際上是什麼? 圖中哪個變數是你目標中的DV其實你可以直說,雖然用推敲的也能看出來。 : 5.若試想比較兩個多元迴歸模型 : D=aA+bC+cE R^2=0.728 : C=aA+bB+cD R^2=0.891 : 這時候是不是可以說 以自變數ABD預測C比起另一組合預測D來得準確有效? : 還是說兩組應變數不同不能相比 只看R2是可以如此描述,特別是剛好二個迴歸式都有一樣多的自變數。 留意這沒有統計推論,且二個迴歸式也經過診斷才行。 不過,實質上這有意義嗎? 我的預測身高公式比你的預測體重公式還準,啊? : 問題有點雜 還煩請統計高手回答解惑 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.248.222.1 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1566544424.A.88A.html ※ 編輯: andrew43 (60.248.222.1 臺灣), 08/23/2019 15:25:15