→ andrew43: 「先規定好 y 截距(例如已知二變量成正比)」你確定? 01/02 11:52
擬合用的模型是 y=ax (這就是手動規定 y 截距=0)
極小化 Σ(y_i - a*x_i)^2 得到 a=[Σ(x_i*y_i)]/[Σ(x_i^2)]
不過至少物理上這個做法滿常用到。
因為很多模型已經確定是正確的,例如測量一物體的密度:D=M/V。
在校正過所使用的儀器後,
1. 把測得的質量對體積作圖,計算迴歸直線斜率。
2. 把測得的質量對體積作圖,計算最佳過原點直線的斜率。
3. 對每筆數據計算 M/V,再求其平均。
以上三個方法應該都可行,只是今天剛好選了2而已。
還是說這個方法就是胡說八道而已呢?
※ 編輯: Vulpix (61.230.122.4), 01/02/2017 13:08:51
推 andrew43: 你的意思應該是截距為0而不是固定截距。就算不為0,變 01/02 13:14
→ andrew43: 數間仍可存在正相關。 01/02 13:14
→ andrew43: 有截距項的最小平方法回歸的R2才會是Pearson相關的平方 01/02 13:17
→ andrew43: 。 01/02 13:17
→ Vulpix: 我說的「先」是指在選定模型的時候就不考慮截距非0的可能 01/02 13:20
→ Vulpix: 那……這樣跟我先固定了截距=0有差嗎? 01/02 13:21
→ arbiteron: 畫資料散佈圖跟你的模型看看,配適結果可能比水平線還差 01/02 14:33
→ Vulpix: 這個我知道,可是我想問的是這樣的「R^2」應該如何詮釋。 01/02 14:50
→ andrew43: 我沒檢查你的R^2算對了沒,但它不可能小於0。 01/02 15:41
→ andrew43: 如果算對了,R^2的意義一直是存在的,和相關不必有關係 01/02 15:42
→ andrew43: 意義就是「總變異能被迴歸線解釋的量」。 01/02 15:43
→ Vulpix: Excel給的數字就是會有負的,所以才難以想像… 01/02 17:29
→ b99703117: 不放截距項,R2就可能會是負的;而且也不能用一般 01/02 18:14
推 andrew43: 那就是算錯了,或者不知道算成什麼東西。 01/02 18:15
→ b99703117: 教科書上的敘述去解釋。 01/02 18:15
→ b99703117: 另外一提,我認為你的資料很可能不同意截距為0的假設 01/02 18:18
→ b99703117: 你可以跑一個一般的OLS,然後檢定常數項=0試試看 01/02 18:18
我想應該是我的說法有問題……
Excel 給了 R^2,
但沒有一個地方找的到公式,那個公式是我自己嘗試幾筆數據後歸納而得。
(也經過多筆隨機產生的數據驗證過,所以程式給的 R^2 就是這麼算的。)
目前遇到的數據若真的「應該」成正比,那用這個模型擬合的效果其實不差。
而 R^2 也頗接近 1,通常也比相關係數^2小。
但是「從公式來看」,R^2 有可能是負值,
所以不應該單純以相關係數的角度去詮釋它。
甚至,它似乎應該當成某種更廣義的東西,但那到底是什麼?
經過配方,公式可改寫成:
R^2 = r^2 - (σ_X/σ_Y)^2 / <X^2> * (b-"最佳b")^2
其中 r 是 Pearson 相關係數,
σ_Z 表示 Z 這組數據的樣本標準差,
"最佳b" 則是一般線性迴歸所得的 y 截距。
※ 編輯: Vulpix (61.230.122.4), 01/02/2017 18:49:06
→ Vulpix: 抱歉,這麼晚才看到這篇。我要找的就是樓上給的,感恩! 04/09 14:24