精華區beta Elephants 關於我們 聯絡資訊
※ 引述《KDDKDD (KDD)》之銘言: : 光看AVG能破一 我就快笑翻了XDD : 你有看過機率能破一的嗎? 那是以兩打席來算 攻跟守,我固定都是用兩打席來比較 或許你可以把他當期望值來看 : 別耍什麼嘴皮了 : 我們簡單來量化一些數據 : 讓你曉得守備和打擊差在?! : 請您看完之後別再亂發數據虐待大家或引人逗笑了 : (過程中我會簡單解釋算法來源 : 必要做一些合理假設) : 拿你最愛的潘和師兄拿舉例 : 同樣都守二壘中 : (I) : 因為中職沒有守備局數 : 所以只能使用BJ 守備局數預估法 : 大師兄今年約守了1826個出局數 (601局左右) : 潘萣翔今年約守了368個出局數 (123局左右) : 目前我還沒看過有人研究NON-ER對E的曲線分析 : 所以我只能合理去推論 : 今年象隊118次失誤 104非自責分 : 平均0.88 分/E : 以統計來說 1B平均期待分是0.5 分 : HR平均期待分是1.44分 : 0.88分算是合理範圍 : 那麼 依E/IP*9*0.88 (每九局預期因守備而失分) : 林智勝 -0.27 分/每九局 : 潘萣翔 -0.13 分/每九局 這點問題很大,因為你只考慮到失誤當下的非自責分,隱形失誤的影響呢 我想討論的,從不單只是失誤 守備範圍小放過的安打,雙殺沒殺到,都不在這套算法裡面 所以你套這個算法進去,是高估了師兄的守備能力,和低估了師兄多掉的分數 : (II) : 目前 : 林智勝 XR/27 10.11 : 潘萣翔 XR/27 4.74 : 林智勝 出局數/PA ==> 0.60 : 潘萣翔 出局數/PA ==> 0.69 : 依XR/出局數*A : A若是每場可打4PA 該球員預計出局數 : 則林智勝預計是 0.90分/一場 : 潘萣翔預計是 0.48分/一場 : A若是每場可打5PA 該球員預計出局數 : 則林智勝預計是 1.12分/一場 : 潘萣翔預計是 0.60分/一場 : 看出這兩位的等級差別了嗎? : 假設這兩位站滿2B全場 : 林智勝預期淨分從 0.63~0.75分 /一場 : 潘萣翔預期淨分從 0.36~0.48分 /一場 : 如果把場數拉大到120場 以今年上半季WS來說約13分換一場 : 林智勝 是75.6~90分 約可帶來5.81勝~6.92勝 : 潘萣翔 是43.2~57.6分 約可帶來3.32勝~4.43勝 打擊方面我贊同 但有空的話,或許可以算算周董和潘潘的差異 因為我也不認為潘潘可以取代師兄 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.110.57 ※ 文章網址: https://www.ptt.cc/bbs/Elephants/M.1473439491.A.5EB.html
vince4687: clown 09/10 00:46
CentaurM83: 鬧劇要什麼時候才會結束 09/10 00:53
suzy0717: 還來 09/10 00:53
ll8833: 去統計板吧zzzzz 09/10 00:57
angel90380: 什麼時候才會結束zzzz 09/10 01:01
ohnacl: 其實WS就有考慮到守備機會和雙殺,自己不看 09/10 01:02
Chad0523: 兩打席來算avg就會破1(筆記 09/10 01:02
lakersPOYU: 洗版中 09/10 01:09
CGtheGREAT: 你兩個打席打擊率會破1 !? 是兩個打數三支安打? 09/10 01:13
你把他想成是AVG或OBP創造出的"期望值"而不是機率,就可以理解了 攻守互相比較固定是採兩個打席,分子和分母同除以2 有沒有先除2,對最後的數據沒有影響
CGtheGREAT: 哪國的棒球? 09/10 01:14
excelsior: 也未免太小看數學 09/10 01:15
toweryang100: 你要扯隱形失誤 就只能去蒐集每場比賽每個play 09/10 01:16
jkhcc: 這數學爛成這樣還敢出來秀下限 09/10 01:16
toweryang100: 然後一個一個來討論 另外建立一個E'的數據 09/10 01:16
toweryang100: 我們再來討論 每次發現被打臉了就在那邊隱形失誤 09/10 01:17
隱形失誤確實要一場一場去記錄才知道有多少 但沒有紀錄,卻確實存在的事實,為了統計方便而忽略,不就會導致數據不準確? 所以我為什麼才要問的是,單一一個 "該出局而未出局的play" 所造成的後續效應為何?
chuegou: 要討論數據就去找 不要在那邊隱形失誤 09/10 01:22
toweryang100: 你該出局的定義就沒有訂清楚了 後續都沒有意義 09/10 01:25
toweryang100: 所謂該出局的標準是甚麼 釣蝦接得到跟周董接得到 09/10 01:25
toweryang100: 這就天差地遠了 09/10 01:25
toweryang100: 任何數據一定有瑕疵,不然比賽前電腦跑一跑就知道 09/10 01:26
toweryang100: 誰贏了 09/10 01:26
followwind: 隱形失誤的定義是什麼?今天釣蝦場追得到的球和甩甩追 09/10 01:28
followwind: 不到的球你難道要把甩的算成隱形失誤? 09/10 01:28
沒錯阿,如果今天是要把釣蝦跟周董兩人攻守的貢獻 就是要算周的隱型失誤,或是說"該出局而未出局"更明確 所以我原文的例子不就說了,有沒有"隱形失誤",是相對兩個野手來說 同樣的,美技造成的多一出局數也是一樣意思 再拿上週凱文先發的那場比賽做例子 一局潘潘的那個美技,師兄應該接不到 所以那球對潘潘和師兄來說,潘潘比師兄多創造了一個出局數 但昂估可以接得到,所以對潘潘和昂估來說,就沒有出局數的差異
followwind: 隱形失誤要是能量化的話美國專門研究進階數據的早就 09/10 01:29
followwind: 弄出來了 09/10 01:29
科學不能證實的東西,難道就不存在 因為無法量化,就將其忽略 那球員在守備方面貢獻的準確性難道不值得討論
yankeefans: 你先把有"隱形失誤" "開守下未守下"的樣本數抓出來 09/10 01:36
yankeefans: 我們再來討論好了 09/10 01:36
yankeefans: 麻煩 不要跟我舉例子 你要玩數據 請給樣本"數" 09/10 01:37
hunng5: 因為守備瑕疵造成隱形失誤但是紀錄組沒有記E,記安打的, 09/10 01:40
hunng5: 野選(至少抓到壘上跑者)的要怎麼計算 09/10 01:40
所以很可惜阿,版上這麼多能人 還是無法解決"非失誤的守備瑕疵"導致的失分 既然從大數據無法解決,何不嘗試著從單一play去切入呢 我的算法有問題,或許數據達人可想出個更精準的算法 ※ 編輯: ensuey (61.230.110.57), 09/10/2016 01:52:24
hunng5: 科學驗證就是要提出假設 蒐集樣本數,然後在做分析 像失誤 09/10 01:45
hunng5: 就有好幾個樣本 要加場地安打沒有記失誤的樣本數吧 如因 09/10 01:45
hunng5: 為判斷失誤造成的歐把呢?周有幾個play是這種情形的呢? 09/10 01:45
hunng5: 科學不是就要有根據證明嗎? 09/10 01:46
yankeefans: 他不都說"難道科學無法驗證的事就不存在了嗎" 09/10 01:48
yankeefans: 對比他算了這麼多的數據 嗯 09/10 01:49
CGtheGREAT: 可以兩個打席算 自創數據還談什麼?棒球可以一次兩個 09/10 01:50
CGtheGREAT: 打席嗎?無視規則限制? 09/10 01:50
yankeefans: 你想用幾個簡單數字去說明棒球場上的現象 基本上就是 09/10 01:53
yankeefans: 個很大的錯誤啊 還扯什麼能人很多沒人算得出 09/10 01:53
yankeefans: 不談數字 "非失誤的守備瑕疵"先定義清楚啊 09/10 01:54
yankeefans: "瑕疵"的標準如何定義?釣蝦跟周董的"瑕疵"標準一樣嗎 09/10 01:55
ohnacl: 愈扯愈遠,有人說守備要忽略或不值得討論嗎?問題是你真 09/10 01:55
ohnacl: 的有要討論嗎?講了你又不聽,在那邊五四三,這樣真的值得 09/10 01:55
ohnacl: 討論嗎? 09/10 01:55
yankeefans: 連定義都有問題的"樣本"算出來的"數據"又代表什麼? 09/10 01:56
yankeefans: 然後就"別人笑你太瘋顛 你笑他人看不穿" 09/10 02:00
cityhunter04: 直接噓,廢文還繼續回! 09/10 02:00
yankeefans: 這叫討論喔 09/10 02:00
我從頭到尾都在討論單一play 也就是一個"該出局而未出局"已經實際發生的情況下,產生的後續影響 "該出局而未出局"或"隱形失誤",是兩個選手之間相對的 所以就看你要抓哪兩個選手出來比
hunng5: 判斷失誤記安打?原本可以雙殺,因為漏球只能抓一個 有記 09/10 02:04
hunng5: 失誤嗎? 09/10 02:04
hunng5: 因為場地問題讓防守員反應不及漏球呢?太多情形了 09/10 02:04
toweryang100: 一堆東西交代得不清不楚 被洗臉了開始硬凹 09/10 02:06
ohnacl: 中職雖然沒有zone rating, 但還是可以去找其他數據來看看 09/10 02:07
toweryang100: 然後在這邊"版上這麼多人....." 能把你說的東西 09/10 02:07
ohnacl: ,以師兄的例子,他少接一球或沒完成雙殺,在WS都是會被 09/10 02:07
ohnacl: 扣分的,或者你也可以去找range factor來比較,只會在亂 09/10 02:07
ohnacl: 創數據或講些虛無飄渺的東西是沒有用的 09/10 02:07
你可以算win share出來看看 但我很好奇,K大為何不算這個,若它真的這麼有代表性
toweryang100: 用科學方法算出來的人早就被mlb請走了好嗎 跟你在這 09/10 02:07
toweryang100: 543 09/10 02:07
toweryang100: KD大繳出了一份合理但有瑕疵的數據>>你亂算 09/10 02:08
yankeefans: 討論單一play 然後用莫名其妙的邏輯算了一個數字 09/10 02:12
yankeefans: 然後用這個數字下一個"整體性"的結論 不覺得哪怪怪的? 09/10 02:13
yankeefans: 用中文的說法叫"以偏概全" 09/10 02:14
toweryang100: 舉例:人都會死 所以會死的都是人 09/10 02:14
hunng5: 而且你知道1局會讓1.65打席上到壘包 那1.65個打席變數太多 09/10 02:15
hunng5: 了 09/10 02:15
hunng5: 難道那1.65位打者上壘都是失誤上壘的嗎? 09/10 02:16
yankeefans: 選用"OPB"當成立論的主軸 基本上就已經忽略上壘的各種 09/10 02:17
yankeefans: 變數了 09/10 02:18
yankeefans: 而只論"上壘" 但諷刺的是你想談"因失誤而造成的上壘" 09/10 02:19
yankeefans: 想談可以啊 要不要先想辦法算個"因失誤上壘率" 09/10 02:20
其實失誤和隱形失誤在我的例子當中都是一樣的 重點都是製造了一個"該出局而未出局" 失誤所創造出的 OBP 期望值一樣會是 1.000 不要拘泥於 AVG OBP SLG 三個名詞,就會瞭解
yankeefans: 而失誤還有很多種"傳球失誤""接球失誤""不算失誤的瑕 09/10 02:21
yankeefans: 疵" 還有失誤發生的責任歸屬認定...有沒有覺得很複雜? 09/10 02:22
hunng5: 然而還包括隱形失誤造成的上壘這個變數才行 09/10 02:22
followwind: 太好笑了。原來守備範圍比較小也算是隱形失誤wwwww 09/10 02:22
hunng5: 除非有幾位很專業的紀錄組邊看球邊統計 還要考慮那麼複雜 09/10 02:25
hunng5: 的變數才能算出來的東西 要是真的研究出來 早就被日美韓 09/10 02:25
hunng5: 挖腳過去了吧?科學野球 09/10 02:25
yankeefans: 算了...我放棄 09/10 02:25
followwind: 你這邏輯根本不通。那請問你的隱形失誤標準是跟誰比? 09/10 02:26
兩個選手之間相比
yankeefans: 投手投的太甜被打安打 是不是也是"該出局而未出局" 09/10 02:26
yankeefans: 因為他可以不用投那麼甜 09/10 02:26
yankeefans: 到底是誰拘泥啊... 09/10 02:27
不論記錄上是失誤還是安打上壘,都是製造了一個人上壘 也就是在那個打席產生的OBP期望值都是1.000
followwind: 你這有種po到sabermetrics版看看會不會被電到飛起 09/10 02:27
toweryang100: 這種算式跟邏輯真的在高中報告都會被打槍 09/10 02:28
ohnacl: 又在伸手牌,你以為WS很好算啊?給我錢我幫你算,如何? 09/10 02:28
yankeefans: 一直在用奇怪的邏輯自圓其說...我放棄了 09/10 02:29
followwind: 那打者未掌握到失投球是不是可以給個該安打沒安打的 09/10 02:29
followwind: 數據?你覺得這聽起來不蠢嗎? 09/10 02:29
toweryang100: 你先舉了三圍來做詭異的運算,又叫我們不要拘泥三圍 09/10 02:29
toweryang100: 真的0說服力 噴列斯特連3天比較有立足點 真的 09/10 02:30
ohnacl: 還有你想推翻進階數據麻煩找個更精確的東西來好嗎? 09/10 02:30
原文用 AVG OBP SLG 來說明確實不妥 但你把每個機率都乘以 1 (打席),看成期望值,其實就可以理解了 推翻進階數據,跟探討這個單一play是兩回事 K大所po的跟我要討論的,其實也不是同一個議題
followwind: 你算了一個破1的打擊率然後說不要拘泥在三圍上? 09/10 02:30
yankeefans: 你這不是自打嘴巴嘛 那你拿這數據說失誤造成的影響 09/10 02:31
yankeefans: 結果是"不論是失誤還是安打上壘,都是製造一個人上壘" 09/10 02:32
toweryang100: 從命題>採數據>運算>推論 沒一個看得懂 09/10 02:32
followwind: 兩個選手相比更好笑。請問你要怎麼去量化因為range大 09/10 02:33
followwind: 小而可能造成的安打/出局?拿你的肉眼做判斷? 09/10 02:33
yankeefans: 依這邏輯 命題應該改成"投手讓人上壘的後續效應" 09/10 02:35
yankeefans: 然後我不用算數據也可以知道 投手要多投人次 可能會多 09/10 02:36
followwind: 講真的你繼續去檢討列都比自己去隨便編一個數據出來要 09/10 02:36
followwind: 有建設性。 09/10 02:36
yankeefans: 用球數 吃的局數可能變少 可能會失分... 09/10 02:36
toweryang100: 好,所以你要定義你1.3的avg用期望值怎麼解釋嗎 09/10 02:37
那個AVG數據的期望值確實沒什麼意義,所以我原文中從未討論這一點 但AVG基本上是包含在OBP中,所以討論OBP的期望值就有意義了 兩打席的OBP期望值是1.370,不就代表了這兩打席中會有1.37個打者上壘 1.000是已經發生的,而0.370是還未發生的 這個OBP期望值代表的是上壘的人數,而不是本身機率的含意
Phatmen: 「已知」前一棒因失誤上壘,要推算下一棒,是要用條件機 09/10 02:43
followwind: 我到底看了三小 09/10 02:43
yankeefans: 期望值的用法 上面那篇已經有人教你了 麻煩去看一下 09/10 02:43
Phatmen: 率,把已知情況放在分母,而不是「已知」上壘,上壘率為1 09/10 02:44
Phatmen: 再把他加在分子 09/10 02:44
followwind: 機率是可以這樣加在一起的喔?喔天啊 09/10 02:45
toweryang100: Ph大正解 你用錯誤的機率算法硬搞成期望值還是不會 09/10 02:46
toweryang100: 對 09/10 02:46
hunng5: 那個1就是全部的變數加總起來的總和阿 就像一個硬幣有正 09/10 02:49
hunng5: 反兩面的意思一樣 09/10 02:49
若把原數據 OBP 改成上壘數 SLG 改成壘打數 OPS 改成上壘數+壘打數 AVG刪除不看呢 這樣就是一個絕對值,而不是機率了,但其實數字是不變的
yankeefans: 你還是沒抓到重點啊 你要討論"失誤上壘" 卻沒一個數據 09/10 02:52
yankeefans: 能確實反應"失誤"這個變數 09/10 02:53
※ 編輯: ensuey (61.230.110.57), 09/10/2016 03:00:51
stond007: 還來XD? 09/10 06:46
ismark2000: 認真覺得你可以找KDD私下聊數據比較快 09/10 06:46
ismark2000: 也只有他比較認真回應你,而且他才懂到底算甚麼數據 09/10 06:47
ismark2000: 啊 09/10 06:47
cocono2: 不是吧?舉例拿周董<>釣蝦?啥時釣蝦能頂周董守兄弟外野 09/10 07:06
cocono2: 了?要研究也是從同個選手正常&非正常發揮來判斷不是嗎? 09/10 07:06
cocono2: 照這樣說4隊的外野安打全都是隱形失誤了XD 09/10 07:06
gingsow: 真的是小朋友... 09/10 07:40
jackal9400: 所以就是湊數字咩 09/10 08:58
excelsior: 照這篇算法 如果前一棒大師兄守下來 兩棒的AVG變成0.15 09/10 09:47
excelsior: 自己算起來都不會覺得怪怪的嗎? 我到底看了甚麼? 09/10 09:48