精華區beta NY-Yankees 關於我們 聯絡資訊
關於盜壘之類的數據,我覺得跟其他數據有很大基本上的不同在於: 1、樣本空間問題:盜壘的時機是由攻方決定,攻方並不是非盜壘不可, 所以不同投手或捕手光是遇到盜壘的次數,以及每次盜壘的難度都 可能不同,個體差異很大。(想像一個考試,每個人拿到的考卷 都不一樣,難度不一定,配分也不一定) 2、樣本數問題:樣本數實在太少,誤差就大,拉長時間可以增加一些 樣本數,但拉長時間又會帶入時間的變數,畢竟時間一長就容易有 變化(像是選手的成長、老化或是傷病)。 要問我的意見,一直以來我都是這樣解讀的,盜壘嘗試次數代表的是 對手如何評估你的防盜能力(其實應該還要把上壘情形考慮進去,畢竟 有人在壘上,才能決定要不要嘗試盜壘),而成功率代表的是,對方 的評估跟你的實際能力之間的誤差。 阻殺的情形也是類似。一點意見,跟大家分享。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.126.2.66 ※ 編輯: jackcselab 來自: 59.126.2.66 (08/20 13:57) ※ 編輯: jackcselab 來自: 59.126.2.66 (08/20 13:57)
CCLu:第一個就是 sample selection bias,有沒有適當中文翻譯? 08/20 16:49
CCLu:是叫做『樣本選擇偏誤』嗎? 08/20 16:50