看板 Statistics 關於我們 聯絡資訊
如果是跟統計軟體有關請重發文章,使用程式做為分類。 統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,善用E做檔案編輯 各位大大好 小弟今天在跑一個多項式回歸的時候,遇到一個想不通的問題。還請各位大大指教。 使用軟體為R,該多項式為y = ax1 + bx2 + c, R裡面的寫法為lm(fd$V1 ~ fd$V2 + fd$V3) 得到的結果如下: lm(formula = fd$V1 ~ fd$V2 + fd$V3) Residuals: Min 1Q Median 3Q Max -518.00 -186.55 11.61 144.50 793.08 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -204.793 30.195 -6.782 1.36e-10 *** fd$V2 -159.113 56.789 -2.802 0.00559 ** fd$V3 74.524 2.347 31.755 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 242.3 on 196 degrees of freedom Multiple R-squared: 0.8551, Adjusted R-squared: 0.8536 F-statistic: 578.2 on 2 and 196 DF, p-value: < 2.2e-16 這個結果初步看起來好像沒什麼問題,包括NN或殘差圖。但問題來了,仔細看了一下 資料才發現V1跟V2放錯了。所以我就把式子改寫成lm(fd$V2 ~ fd$V1 + fd$V3) 得到新的結果如下 lm(formula = fd$V2 ~ fd$V1 + fd$V3) Residuals: Min 1Q Median 3Q Max -0.60536 -0.16242 -0.08425 0.19343 0.88583 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.874e-01 3.593e-02 -8.001 1.06e-13 *** fd$V1 -2.420e-04 8.638e-05 -2.802 0.00559 ** fd$V3 3.526e-02 6.718e-03 5.248 3.97e-07 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.2988 on 196 degrees of freedom Multiple R-squared: 0.2191, Adjusted R-squared: 0.2112 F-statistic: 27.5 on 2 and 196 DF, p-value: 2.965e-11 雖然p-value還是可以接受,但R2值下降超多。請問這會是什麼原因造成的呢? 還有,要如何做才能提升新的回歸式的R2值? 會是因為V1V2的SCALE差太大嗎? 麻煩各位大大指教,謝謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.163.221.90 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1540271863.A.34C.html
Pieteacher: 標準化看看 10/23 13:32
nocas: 感謝。但標準化後,R2只增加到0.23左右。 10/23 13:59
Pieteacher: 做個 lack of fit test 看看是不是沒有把一些高階效益 10/23 14:47
Pieteacher: 放入 ex: X^2 之類的 10/23 14:47
andrew43: 說不定只是單純V3,V1的相關小而V3,V2的相關較大 10/23 18:18
andrew43: 上面相關的大小說相反了 10/23 18:19
yhliu: 本來就是兩回事, R^2 哪能相比較? 10/25 08:27
evilove: 不同依變項比較沒有意義 10/29 03:11