精華區beta NY-Yankees 關於我們 聯絡資訊
感謝大家在王指數那篇的批評和指教,今年小王都不小王了! 現在我來分析幾個投手的三振出局K,滾球出局G,飛球出局A,原始資料在表二。 經過比例及四捨五入至整數,整理如表一。 K+G+A應該等於10,因為四捨五入關係,有時會等於9或11。但是整數比較好記。 而兩個投手的相似度可以計算他們的歐幾里德距離Euclidean distance. 定義: (K1,G1,A1)和(K2,G2,A2)的歐幾里德距離Euclidean distance為 Sqrt((K1-K2)*(K1-K2)+(G1-G2)*(G1-G2)+(A1-A2)*(A1-A2)) 王和Webb的2006年Euclidean distance=Sqrt( 4+ 0 +0)=2 王和Santana的2006年Euclidean distance=Sqrt( 9+9+1)=4.4 王和Becket的2006年Euclidean distance=Sqrt( 4+4+4)=3.5 王和Mussina的2006年Euclidean distance=Sqrt( 4+9+4)=4.1 所以王和Webb比較相近,而王和Santana差異很大。 以上是個簡單的分析。 表一 K G A Wang NYY 2006 1 6 2 Webb ARI 2006 3 6 2 Santana MIN 2006 4 3 3 Becket BOS 2006 3 4 4 Mussina NYY 2006 3 3 4 K G A Wang NYY 2007 2 6 2 Webb ARI 2007 3 5 2 Santana MIN 2007 4 3 3 Becket BOS 2007 3 4 3 Mussina NYY 2007 2 4 4 表二 K GO AO ERA Wang 2006 76 407 155 3.63 NYY 2007 29 115 42 3.73 Webb 2006 178 400 118 3.1 ARI 2007 82 142 45 3.13 Santana 2006 245 218 228 2.77 MIN 2007 96 69 87 3.24 Becket 2006 158 237 216 5.01 BOS 2007 67 85 62 2.88 Mussina 2006 171 205 210 3.51 NYY 2007 23 61 53 5.63 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.57.134.215
xsonic:我可以問為什麼要四捨五入嗎? 06/12 11:09
pasaword:不要再算了= =一點意義都沒有= = 06/12 11:09
galewind:我覺得很有意思,樓上的想法頗反進步-_- 06/12 11:11
xiemark:四捨五入比較好用手算,整數比較好記。 06/12 11:12
bonjou:加油~不同的分享 換換口味也不錯呀... 06/12 11:14
mightymouse:我想知道的是,這個東西跟勝場或是得失分的關係 06/12 11:15
xiemark:這個只是分析投手的滾、飛、三振的相似度。 06/12 11:16
xiemark:王和Webb的類型比較相似,而王和Santana差異很大。 06/12 11:18
bartschen:牽制出局?盜壘刺?雙殺? K+A+G根本不會是10 06/12 11:18
bartschen:算這個確實很沒有意義,得出來的結論還不如看row data 06/12 11:19
ph49:我覺得看圖比較一目暸然... 06/12 11:20
bartschen:來得快 ↑raw data 06/12 11:20
xiemark:10K/(K+G+A) 10G/(K+G+A) 10A/(K+G+A)三個加起來是等於10 06/12 11:20
bbszhou:不過請教一下,Webb 2006年的是362加起來11... 06/12 11:26
bartschen:嗯 我懂了 以上面的算法確實是10 抱歉 06/12 11:26
shancko:還什麼歐幾里得距離勒 明明就只是個三軸的樣本區 06/12 11:26
bartschen:不過這樣算,K和G很強的與K和G很弱的,跟小王的計算後 06/12 11:27
shancko:小王的數據當一個點 跟他距離一樣的是一個球面 06/12 11:27
bartschen:差距都差不多,根本看不出什麼 06/12 11:27
shancko:這個球面上的投手型態根本完全不一樣 你算一百年也沒用 06/12 11:28
GameDemon:我覺得這系列蠻有趣的阿 推~~~~~ 06/12 11:28
bonjou:To 6樓 決定勝場得失分的因素不只投手表現阿0.0打線打線!! 06/12 11:28
shancko:xie老哥 不用說什麼歐幾里得距離 這是我國中學的兩點距離 06/12 11:29
shancko:這只是一個簡單數學 你想想看吧 06/12 11:30
bonjou:唉唷~認真分析值得鼓勵 也感謝資深版友的教導 06/12 11:30
bartschen:說真的不是要貶低他,實在是算這個沒什麼意義 06/12 11:32
bartschen:Santana(4.4)和Mussina(4.1)是一樣類型的投手嗎? 06/12 11:33
shancko:我不資深 但是要做數據分析總要有點基本原理吧 06/12 11:32
bonjou:I know...^^ 06/12 11:33
shancko:一開始很多人以為他搞那個王指數是純搞笑 結果他搞上癮了 06/12 11:34
shancko:避免他繼續浪費寶貴時間 還是趕快戳破他吧 XD 06/12 11:34
ufoon: 好屌 06/12 11:35
kykosun:雖然我也覺得這個沒多大意義..但我想說有多少研究是真的 06/12 11:37
kykosun:很有意義的?? 06/12 11:38
cheer16max: QQ 賺P幣阿 06/12 11:42
shancko:樓上 原po看起來是認真想搞 但是基本原理有大漏洞 06/12 11:42
asdfzx:原po玩一下有何不可? 只是一篇又沒有洗板 可以接受吧 06/12 11:43
twpy:原PO算得再多還是會有專業人嗆你,學她們酸人才能顯現專業啦~ 06/12 11:52
tombknight:個人覺得就看球就好了..算這個真的沒啥意義... 06/12 11:54
tombknight:小王跟santana本來就完全不同類型..不用算也知道 06/12 11:55
FATDUDU:覺得這個沒有太大意義 +1..... 06/12 12:00
ZzzBa:shancko只會打嘴泡還會什麼 06/12 12:00
twpy:看球就好?純看球會被某些人嗆不懂棒球咧~ 06/12 12:00
bonjou:=========================停戰=======================^^ 06/12 12:01
NTUST:我想選手數據有很多種,但是能夠被採納的都是經過長時間的証 06/12 12:01
NTUST:明..說不定有許多我們沒看過的數據統計,但是不夠完美... 06/12 12:02
xiemark:接受大家戰、酸、批評,這樣才會進步。 06/12 12:04
bonjou:xiemark 你的精神值得肯定 可是如果流為各式各樣的嘴砲 06/12 12:07
otakiller:這東西能拿來幹麼? =_=|| 06/12 12:08
bonjou:而不是對主題的建議 似乎就脫離本意了 06/12 12:08
NTUST:成功的路有時候不好走..尤其是你面對的是百年歷史的東西.... 06/12 12:08
Romulus:shancko你知不知道你國中學的兩點距離就叫做歐基理得距離 06/12 12:10
Romulus:而且xie又沒說這數據代表什麼什麼 純算數據有啥問題嗎-_- 06/12 12:11
railiam:什麼都可以有數據...有沒有意義而已... 06/12 12:16
retry:第二段XIE就有說這個數據代表什麼了...問題是算個沒路用 06/12 12:17
retry:的數據就沒有意義PO了 06/12 12:18
Romulus:此數據代表中心點和計算點的出局分佈相似度 06/12 12:19
Romulus:注意:只有和中心點的距離才有意義 06/12 12:19
madgame:奇怪了,這個數據就是在表示其他投手跟王建民的相似度啊 06/12 12:25
madgame:到底是哪裡沒意義 06/12 12:26
madgame:原po創造出一個以王建民為中心的數據,這是他的興趣 06/12 12:27
madgame:不曉得是在批什麼。之前那篇王指數也是,原po的第一篇就 06/12 12:28
madgame:說,這是個 [十足自high] 的指數,目的就是讓王建民得第一 06/12 12:28
madgame:一堆批的人沒幽默感就算了,連風度都沒有 06/12 12:30
shancko:回Romulus 我的意思是說不是講個什麼專有名詞就會變利害 06/12 12:41
jasonmammal:如果是算和Roger Clemens的相似度...大概就不會被鞭了 06/12 12:41
shancko:說我打嘴砲的請解釋一下 跟圓心距離一樣的那整個球面 06/12 12:41
shancko:那個球面上的所有投手都是同一類型? 06/12 12:42
jasonmammal:是看距離圓心的距離吧...整個球面,也要看半徑啊 XD 06/12 12:44
jasonmammal:如果半徑取太大 怎麼會有相似度可言呢... 06/12 12:45
shancko:樓上 同一個半徑就有一個球面 一個球面上有幾個點? 06/12 12:46
shancko:一個點就是一個投手 06/12 12:47
madgame:這個數據只能跟圓心比 Romulus不是講的很清楚了嗎 06/12 12:49
shancko:回Zzzba大 你最厲害 我都嘴砲 成大醫科最強 06/12 12:53
fellboy:這板怎麼大家口氣都很嗆?不是在連勝嗎 06/12 12:54
Kird:呃…怎麼覺得樓上大大戰輸人 換話題要改戰學校了 QQ? 06/12 12:54
shancko:Kird我沒戰輸(根本沒想戰啊) 可是Z大丟句我只會嘴砲 06/12 12:57
shancko:所以我查查看Z兄平常發的文啊 看起來不像會隨便罵人的 06/12 12:57
jiunde:一直在這篇打轉 ptt沒其他文章可以看了嗎 06/12 12:59
shancko:發現原來是建中55屆的 好吧 就算我嘴砲好了 建中很強 06/12 12:58
Romulus:球面上各點彼此本來就只有「離中心點一樣遠」,so? 06/12 13:01
Kunoichi:KGA (2,6,2) 跟 (4,6,0) 就算差很近也絕對是不同類型投手 06/12 13:00
asdfzx:天大地大台科大才是最強 06/12 13:01
Romulus:干我們學校屁事…… 06/12 13:02
Kird:成大醫科最強 建中很強 <== 到底跟這串討論有何關係 06/12 13:01
Kird:啊 我好像跳進線裡了 我跳出去好了 不然等等換我被扒… 881 06/12 13:02
Romulus:誰和你說球面上各點要是同類型投手的? 06/12 13:02
shancko:回Romulus大 可是這些跟小王距離一樣遠的點 彼此都不一樣 06/12 13:02
shancko:R大你這樣說 我就認輸了 簡單說 這個分析給我們一個回答 06/12 13:03
shancko:跟小王像或不像 (而且還是比較出來的 距離多小叫像) 06/12 13:05
Romulus:小王可以換成任何其他投手 06/12 13:06
Romulus:像不像本來就是比較出來的…… 06/12 13:07
asdfzx:請問有沒有人會做Cano指數? 06/12 13:06
shancko:R大 那距離多小我們該說像 距離多大我們該說不像? 06/12 13:08
Romulus:你要IsoP/IsoD嗎,盲砲指數(咦) 06/12 13:08
Romulus:你說一個人長的像不像另一個人的時候要多像才會說他像? 06/12 13:09
shancko:上面Kird大 別這樣嘛 是我先被嗆ㄟ 06/12 13:09
shancko:R大 你說對啦 這個指數如果有用代表可以提供像不像的答案 06/12 13:10
Romulus:2比4像 8比6不像 有什麼問題? 06/12 13:11
shancko:各位 本人非想戰 不再回話了 我靜候po更多新的分析 抱歉了 06/12 13:11
sft005:sh大通常在做數據分析本來就要用正確的公式名稱阿 06/12 13:21
sft005:這一點上是毫無問題的 請不用在這邊鞭... 06/12 13:21
sft005:如果你寫篇論文 上面說這是我國中的距離公式 06/12 13:22
sft005:你看教授會不會叫你把這段給修掉... 06/12 13:22
ssall:對勇於創作的人還是給他掌聲吧,至於要批評的寫詳細一點 06/12 13:29
dakkon:怎麼戰到最後說不想戰? 06/12 13:35
retry:原PO蠢1:2006年創立WANG INDEX自嗨,蠢2:2007以為全聯盟只有 06/12 13:35
retry:Wang,Santana及webb三個投手,沒想到A Cook的Wang index更高 06/12 13:39
retry:蠢3:所以再自創一個與王的歐幾里德距離,一整個白癡 06/12 13:41
retry:與Wang像就算在同一隊,ERA與勝投數也會天差地遠 06/12 13:43
NcThoR:好好講嘛 幹麻說人家白痴... 06/12 13:46
caribsea:樓樓上覺得人家蠢 幹麻還那麼關注人家做的分析 關你啥事ꠠ 06/12 14:00
ZzzBa:re大好像很熟"蠢"這個字似的 06/12 14:05
babymilkiss:KY 看到一堆數字就頭大 XD 06/12 14:05
eveningcloud:講理講不贏不贏 就去查別人身家.... 有夠.... 06/12 14:08
fch010720:這指數又不是完全沒道理的,你覺得有需要加強,可以提意 06/12 14:08
fch010720:見呀,但只會說別人蠢,只會顯得自己自大而己 06/12 14:09
eveningcloud:都以為自己是教授一樣在批論文.... 不懂耶 06/12 14:10
lishiter:把別人的興趣當論文批,有些人還蠻有趣的 06/12 14:18
humboldt:KGA完全相同的兩個人,但是一個BB極高一個極低 06/12 14:45
humboldt:這兩個人是相同類型的嗎? 06/12 14:46
ZzzBa:以出局的型態而言 是相近的 只能這樣說 06/12 14:48
humboldt:原po並沒有強調是出局特性,相似度定義太籠統... 06/12 14:49
Romulus:原po沒說 我們繼續解讀 06/12 15:32
shancko:又回來了 是來請教的 KGA(2,4,3)(2,5,4)哪個跟小王比較像? 06/12 15:33
shancko:又或者(0,7,3)(2,5,3)哪個跟2006小王比較像? 06/12 15:39
madgame:0和2的差距可能只是1.4和1.5的差距,樓上的反例舉的差 06/12 15:50
madgame:真要舉反例應該是像(8,1,1)(0,1,9)這種對比吧 06/12 15:51
shancko:抱歉 我是舉的差 我想不出比較好的 那到底哪個比較像? 06/12 15:52
shancko:你那個反例我說不出口 一說就會被說舉太極端的例子 06/12 15:54
Romulus:(2,4,3)(2,5,4)的distance一樣,so? 06/12 15:55
jasonmammal:離圓心越遠當然就沒意義了...何必一直窮追猛打呢? 06/12 15:56
jasonmammal:當然可以取個底限 例如半徑多少以內的球面可以算接近 06/12 15:57
jasonmammal:但這可能要再配合更精細的比較 這篇只是粗略三個數據 06/12 15:57
shancko:R大 距離一樣 所以哪個像? 都像? 06/12 15:58
jasonmammal:就算是距離很接近的兩個 也沒辦法就這三個數據說哪個 06/12 15:58
Romulus:一樣就都像啊 你想說不一樣的話那是四捨五入帶來的誤差 06/12 15:59
Romulus:覺得誤差太大就用回本來的小數點 06/12 15:59
jasonmammal:比較接近...所以你一直在距離相同球面上作文章沒意義 06/12 15:59
shancko:可是如果差距很大的還需要這樣比嗎? 例如Santana跟小王 06/12 16:01
shancko:我光看K/9就知道兩個人不一樣了啊 06/12 16:03
Romulus:Santana和Wang差很多還不是看K/9和GO/AO來的 06/12 16:04
shancko:光看K/9就夠了 所以就不用算KGA了啊 06/12 16:04
Romulus:KGA只是給你另一種選擇而已 所有數據都要正確解讀才有意義 06/12 16:05
Romulus:你要說原po舉例太極端我沒意見 06/12 16:05
Romulus:KGA還比GO/K有意義多了 06/12 16:07
shancko:對不起我才疏學淺 請指點哪裡有GO/K的討論 我想研究研究 06/12 16:08
Romulus:啊上一篇王建民指數不就是GO/K...-_- 06/12 16:17
st60213:二樓的id曾經出現在某個頗為流行的簽名檔! 06/12 17:53
flowwinds:這樣算出來的東西解讀為投手相似度? 06/12 21:13
flowwinds:原po也順便算一下Mahalanobis, Manhattan distance吧.. 06/12 21:14
Annrod:樓上有興趣的話自己可以動手算呀^^ 06/12 21:57
flowwinds:等我有空再說^^ 06/12 22:00
DesertEagleX:不要再惡搞了 原作者倒是說說這樣能看出什麼 06/12 22:20
fishtom:把第一個數據都變成1不就好看許多嗎? 06/12 22:25
fishtom:三個數據都在跳 比較難看出什麼 06/12 22:28