作者ppoll2 (人不在請打手機)
看板MLB
標題Re: [閒聊] 今日Pujols。
時間Mon Sep 5 01:20:13 2011
※ 引述《tatsumi2512 (Ben)》之銘言:
: 小弟發現自己的文章打太長了,無法在自己原本自己的文章下回完,
: 而且尚需要不止1篇的發文,很抱歉變成變相的洗板。m(_ _)m
: to gamer大:
: 抱歉,我統計學的東西幾乎都已經還給老師了。
: 所謂對1B作normaliezed的意思是讓1B在上述假設的情況下,
: 在XR以及在OPS的權重都調整為1嗎?
: 若是如此,那小弟有個疑問:
: 原uranusjr大的權重如下:
: BB 1B 2B 3B HR
: XR 2.0 3.0 4.0 6.0 8.5
: OPS 2.0 4.2 6.4 8.6 10.8
: 若以BB為基準 = 1時,則 (小數點一下3位四捨五入)
: BB 1B 2B 3B HR
: XR 1.00 1.50 2.00 3.00 4.25
: OPS 1.00 2.10 3.20 4.30 5.40
: - 高估 高估 高估 高估
: 若以1B為基準 = 1時,則 (小數點一下3位四捨五入)
: BB 1B 2B 3B HR
: XR 0.67 1.00 1.33 2.00 2.83
: OPS 0.48 1.00 1.52 2.05 2.57
: 低估 - 高估 高估 低估
: 若以2B為基準 = 1時,則 (小數點一下3位四捨五入)
: BB 1B 2B 3B HR
: XR 0.50 0.75 1.00 1.50 2.13
: OPS 0.31 0.66 1.00 1.34 1.69
: 低估 低估 - 低估 低估
: 若以3B為基準 = 1時,則 (小數點一下3位四捨五入)
: BB 1B 2B 3B HR
: XR 0.33 0.50 0.67 1.00 1.42
: OPS 0.23 0.49 0.74 1.00 1.26
: 低估 低估 高估 - 低估
: 若以HR為基準 = 1時,則 (小數點一下3位四捨五入)
: BB 1B 2B 3B HR
: XR 0.24 0.35 0.47 0.71 1.00
: OPS 0.19 0.39 0.59 0.80 1.00
: 低估 高估 高估 高估 -
: 可以看出,
: 除BB為基準 = 1時以外,BB永遠被低估。
: 另,除2B為基準 = 1時以外,2B永遠被高估。
: 但1B, 3B, HR在不同的基準下,有時被高估有時被低估。
: 要如何解釋這種情況呢?
: 是不是在任意調整權數的情況下,
: 比較的基準其實早已跑掉了呢?
: 以上述uranusjr大簡化OPS公式,
: 以1.1 AB = 1 PA得出的下列權重,
: >OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: >所以對於 n = 1.1 而言, 各項權重比為
: >2 : 4.2 : 6.4 : 8.6 : 10.8
: 是不是已經出現誤差。
: 畢竟,n = 1.1時,上述
: OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: 可以換算成
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 其BB, 1B, 2B, 3B, HR的權數應該分別為1, 2.1, 3.2, 4.3, 5.4,
: 但uranusjr大在這裡把各權數 * 2,
: 則
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 會變成
: 2 * OPS * PA = OPS * 2.2 * AB = 2 * BB + 4.2 * 1B + 6.4 * 2B + 8.6 * 3B +
: 10.8 * HR
: 但其實實際上左式會變成 OPS * PA * 2,或OPS * 2.2 * AB。
: 待續。。
迴歸分析是一個邊際的概念,也就是說當已經考慮了其中幾個變項時額外
再加入一個變項有多少的影響力(R-square)。以你的例子裡,這種高低估的說法
有一點點詭異,因為迴歸本身就已經考量了一組資料元素才根據邊際效果導出
一組數據,考量的訊息本身就已經包括你所謂的其他資料。所以我有點看不太懂
為甚麼會有高估跟低估的結論?除非說寫model的人自己加權,將HR的數據加權後再
丟進迴歸裡跑,那應該也只有寫model的人才知道吧。
此外,由於現在非線性迴歸的使用增多,複雜模型的數據模式比較常出現,
我猜我們所看到的數據資料應該不會只是單純的線性迴歸產物。
不負責任回答~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.143.132
※ 編輯: ppoll2 來自: 140.119.143.132 (09/05 01:22)
推 tatsumi2512:謝謝解說。本來只是單純把自己的疑問提出來而已, 09/05 01:24
→ tatsumi2512:結果就變成上面那種情況了。。。 09/05 01:25
→ tatsumi2512:其實還有很長一段我重新編輯在上一篇文章中, 09/05 01:26
→ ppoll2:不 在我的意思裡 我覺得不能夠直接對迴歸係數進行加減乘除 09/05 01:26
→ ppoll2:= = 應該說沒有人會這樣做才對 09/05 01:27
→ EEERRIICC:................ 09/05 01:27
→ tatsumi2512:若ppoll2大有空閒的話,還請不吝指教。m(_ _)m 09/05 01:28
→ tatsumi2512:我發現我在找死。都是你啦,uranusjr大。(指) XD 09/05 01:29
推 tatsumi2512:謝謝ppoll2大的解釋,我能夠理解你要說的內容。 09/05 01:35
→ fenix800704:這一系列數學文Q^Q 09/05 01:36
推 Tulowitzki2:推 09/05 01:36
→ tatsumi2512:當初是邊打文章邊得出:權數直接拿來乘除不會很奇怪嗎 09/05 01:37
→ tatsumi2512:現在發現只要看ppoll2大的: 09/05 01:38
→ tatsumi2512:我覺得不能夠直接對迴歸係數進行加減乘除 09/05 01:38
→ tatsumi2512:這一句話就可以解釋我最大的疑惑了。謝謝。m(_ _)m 09/05 01:39
推 finaltrial:看棒球,學數學。 09/05 02:22
→ SCGT:這串看下來真可怕 09/05 03:01
→ jayin07:許公....救命...... 09/05 05:00
推 simple721:為什麼不行 嘖嘖 09/05 12:32
推 tatsumi2512:小弟認為ppoll2大解釋迴歸分析解答了我許多的疑惑。 09/05 14:17
→ tatsumi2512:想請教simple721大,若可以,是會出現在什麼情況下呢 09/05 14:19
推 CarlvinPiz22:標題火星人,內容火星文....(我是指我程度差看不懂) 09/05 14:43
→ EEERRIICC:完全看不懂 09/05 14:50