推 jdtrue:大推 BR的資料量真的很恐怖... 04/24 03:23
推 abc0922001:同意推 04/24 03:47
→ LetsGoNY:BB真得是好物啊 04/24 04:01
推 jayin07:有段時間愛fangraphs勝過愛用BR 04/24 06:08
推 gbpacker:都是很棒的網站,推~~~ 04/24 07:05
推 seeyou1002:push 04/24 07:45
推 Fanicom:推推 04/24 10:56
推 APNA:推BR,感謝分享 04/24 11:47
推 skycrawler:大推 可否置底? 04/24 23:49
推 chien533:Sean還滿nice的,幾次寫信問他查資料的問題都回的滿快的 04/25 01:07
推 Sechslee:推 04/25 13:26
推 dufflin:哇 07/12 20:02
> -------------------------------------------------------------------------- <
作者: Beisbol (Béisbol) 站內: MLB
標題: Re: BBRef網站成立十週年,推出十項新功能
時間: Mon Jul 12 03:26:41 2010
3. Player Uniform Numbers
http://www.baseball-reference.com/blog/archives/5105
Posted by Sean Forman on March 24, 2010
許多人長期以來都希望我們有球衣號碼的資料,如果你是 Sports-Reference.com
其他各項運動資料網站的使用者,你應該知道其他分站早就有這項功能,顯示球員
球衣號碼與球衣代表色;現在bbref也將加入其他分站的行列,新增這項功能。
在球員的頁面,我們有所有1929年以後的資料;隊伍頁面也會在「Roster & Uni-
form」分頁之下顯示該年全隊的球衣號碼;隊史頁面則會顯示所有退休號碼,以下
是幾個例子:
a. 最專一的球員
http://www.bbref.com/players/w/willibe02.shtml
b. 穿過最多件球衣的球員
http://www.bbref.com/players/b/brunege01.shtml
c. 1979年太空人隊陣容
http://www.bbref.com/teams/HOU/1979-roster.shtml
d. 2009年洋基隊陣容
http://www.bbref.com/teams/NYY/2009-roster.shtml
e. 勇士隊所有退休號碼
http://www.bbref.com/teams/ATL/
我們也將頁面與名人堂存在已久的「Dressed to the Nines Exhibit」網站作連結
,你將可看到該球員生涯各年(或是該球隊)的主客場球衣全貌。
這項資料庫參考自多個來源,基本上已經很完整,如果你要進行勘誤或有其他建議
,請按下「Report an Error」連結與我們聯絡。
4. Win Expectancy and Run Expectancy
http://www.baseball-reference.com/blog/archives/4718
Posted by Sean Forman on March 26, 2010
(WE = Win Expectancy, RE = Run Expectancy.)
我第一次見到 WE 這個數據,是1990年代後期為《Big Baseball Annual》寫作時
。後來成為 NFL 分析專家、並創立 Pro-Football-Reference.com 的 Doug Dri-
nen,也根據 Mills 兄弟的基礎寫了許多關於 WE 的文章,他的書中甚至有世界
大賽比賽的 WE Graph 圖表。我一直認為 WE 很精準的告訴了我們一場比賽中的
過程中究竟發生了哪些事,我也很高興的告訴各位,現在我們的網站提供了這項
內容。
Tom Tango 在這項工作的過程中提供了很大的協助,他的「得分環境變數」(run
environment)調整了 WE、Leverage、Base-Out RE、Base-Out Leverage 等數據
,是你現在所看到的數字的重要基礎。
在所有我們擁有 play-by-play 資料的比賽中(1952年起),都有 WE 和 RE 的
資料,但只有1974年至今的比賽資料才百分之百齊全,在這之前較早期的比賽則
因部份資料不足而有所遺漏,或者缺少一季之中幾場比賽的資料。
關於資料完整度的統計資料請見:
http://www.bbrefe.com/about/coverage.shtml
a. 投手和打者的頁面都新增了與 WE 和 RE 有關的統計資料,投球或打擊的貢獻
可以直接轉換成勝場數,在「Win Probability」表格中,主要新增的數據包
含了 Adjusted Pitching/Batting Wins、WPA、WPA/LI、REW。
範例:
www.bbref.com/players/m/morrija02-pitch.shtml#pitching_win_probability
www.bbref.com/players/s/schmimi01-bat.shtml#batting_win_probability
b. 在所有我們擁有 play-by-play 資料的比賽 Boxscore 中,都加入了互動式的
WE 表格。
範例:http://www.bbref.com/boxes/MIN/MIN200910060.shtml#wpa
教學影片:http://www.bbref.com/blog/archives/5148
c. 這些數據同時也在球員的「Game Logs」頁面的表格中呈現。
d. 在球隊的「Batting/Pitching Statistics」頁面(點選黑色的「More Stats」
連結)的「Team Win Probability」表格中,新增了全隊的 Win Probability、
RE24、Adjusted Batting/Pitching Wins 等數據。
範例:
www.bbref.com/teams/PIT/1979-batting.shtml#players_win_probability_batting
e. 1952年至今的聯盟頁面中都新增了「Win Probability」的頁面,從導覽列中
的「Batting/Pitching [+]」項目下可以找到並點選。
範例:www.bbref.com/leagues/NL/2007-win_probability-pitching.shtml
www.bbref.com/leagues/MLB/1980-win_probability-batting.shtml
f. 在各種有領先榜「Leaders」的頁面中,也加進這些資料的排行,包括隊史、
單季、生涯、聯盟各年、Progressive 等。
g. 我也新增了一個頁面,非常完整、甚至是囉唆地解釋了創造這些數據的方法,
以及所引用的數據與資料,如有任何的批評指教,請讓我知道。
http://www.bbref.com/about/wpa.shtml
h. 這些資料當然也整合進「Play Index」中,所以你可以做如下的搜尋:
* 1980-2009年,生涯 WPA 最高的後援投手?
http://www.baseball-reference.com/pi/shareit/vNhj2
* 1952年至今,單季 RE24 最高的二壘手?
http://www.baseball-reference.com/pi/shareit/aJk3H
* 連續出賽都是「高張力」(High Leverage)比賽的紀錄?
http://www.baseball-reference.com/pi/shareit/BFHjd
* 2000-2009年,單季最多場比賽單場 RE24 < 0 的紀錄?
http://www.baseball-reference.com/pi/shareit/HYy9J
* 2009年,打者單場最高 WPA?
http://www.baseball-reference.com/pi/shareit/5A6hr
* 當 REW ≦ 0 時,單季 WPA 最高的投手?
http://www.baseball-reference.com/pi/shareit/wt26Z
我很享受新增這些資料的過程,也希望你們在使用時會喜歡,和以往一樣,有任
何的問題或批評皆歡迎提出。我希望第五項新功能很快就能推出,但開幕戰快到
了,有很多事要忙,可能會延遲個一陣子。
5. Player Newsfeeds
http://www.baseball-reference.com/blog/archives/5618
Posted by Sean Forman on April 27, 2010
這是本站十週年慶所計畫推出十項新功能中的第五項,前陣子我都把精力集中在
新球季上,現在才有時間回到這項工作上。在現役球員的頁面中,在基本資料之
下,所能最先看到的就是有關他的新聞。預設是顯示最新的四條新聞,也可以點
選閱讀更多。
新聞來源主要有:
a. MLB Trade Rumors http://www.mlbtraderumors.com/
b. KFFL 的 Hot off the Wire http://www.kffl.com/hotw/mlb
c. 一個有關球員受傷資料的資料來源
d. 我們的blog http://www.bbref.com/blog/
這嚴格來說不算新聞,但會有一些與這個球員有關的有趣內容。
目前大概就是這幾個,如果你是個blog作家或網站經營者,你也可以把你的網站
內容新增到我們的feed中。
請見:http://www.bbref.com/blog/archives/5602
(註:到現在已經新增了數十個feed來源)
6. Advanced Fielding Stats and Leaderboards
7. Player Wins Above Replacement
8. Player Photos, pre-1960
(待續)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.112.118
推 jdtrue:推 07/12 03:29
推 Belladonaa:推 前一篇竟然沒M @@ 07/12 03:30
推 sarserror:太專業喏 07/12 03:32
推 mohicans: 07/12 03:35
推 Sechslee:不推不行 07/12 04:13
推 kenny781558:不推不行 07/12 04:25
推 jardon:推推 07/12 12:34
推 numblife:好物 07/12 12:41
推 cdqwerty: 07/12 16:49
推 a502152000:推 這網站真的好強大 07/12 17:15
> -------------------------------------------------------------------------- <
作者: Beisbol (Béisbol) 站內: MLB
標題: Re: BBRef網站成立十週年,推出十項新功能
時間: Mon Jul 12 14:07:39 2010
6. Advanced Fielding Stats and Leaderboards
http://www.baseball-reference.com/blog/archives/5756
Posted by Sean Forman on May 10, 2010
我們的網站從兩年前開始呈現 Sean Smith 的 Total Zone 資料,以往都只有在
球季結束後一年更新一次,但以後將每天更新。
註:Sean Smith 是 CHONE 和 Total Zone 的發明者
詳見:http://www.baseballprojection.com/
http://www.bbref.com/about/total_zone.shtml
另外我們也取得了2005-2009年的小聯盟 TZ 資料,你可以看出 Jason Heyward
在右外野的守備有多恐怖,平均每年的 Fielding Runs Above 是11分,Buster
Posey 在2009年的 Catcher Runs Above 也有11分。我們目前並沒有計畫在季中
即時更新小聯盟的資料,但這也並非不可能。
範例頁:http://www.bbref.com/minors/player.cgi?id=heywar001jas
http://www.bbref.com/minors/player.cgi?id=posey-001bus
我景仰已久的 Baseball Info Solutions 每年都為 Fielding Bible 提供重要的
守備數據,這也是目前最好的資料來源。而現在我們也與他們達成協定,將他們
從2003年至今的進階守備數據全部呈現在我們的網站上,並且每日更新,包含了:
* Total Defensive Runs Saved
* Plus/Minus Runs Saved (typical fielding plays)
* Bunt Runs Saved
* Stolen Base Runs Saved (for catcher and pitcher)
* Catcher Earned Runs Saved
* DP Runs Saved
* Outfield Arms Runs Saved
* Outfield Home Run Saving Catches
而這也代表我們必須在球員的守備數據頁面中,呈現更多的數據和表格。在球員、
球隊、聯盟的主頁的「Standard Fielding」表格中,現在有來自 TZ 的 Rtot 與
Rtot/yr 資料,以及來自 Fielding Bible 的 Rdrs 與 Rdrs/yr 資料。
在球員的「Fielding」頁面的「Sabermetric Fielding」表格中,整合並呈現了
這兩大來源所提供的資料。要進到「Fielding」頁面,你可以在球員主頁點選導
覽列的「Fielding」,或在「Standrad Fielding」表格標題的旁邊點選「More
Stats」。
在球隊與聯盟頁面的「Standard Fielding」表格中,同樣也有 Rtot、Rtot/yr、
Rdrs、Rdts/yr 等四項數據,但更重要的是有依守備位置、球隊、球員分類的表
格,請將頁面往下捲動就可以看到。
範例:http://www.bbref.com/leagues/NL/2010-specialpos_ss-fielding.shtml
http://www.bbref.com/teams/SDP/2005-fielding.shtml
再次提醒,表格內的所有項目都是可排序的,將游標停留在標題會跳出詳細說明,
「SHARE」連結可以讓你重新排列、刪減、自訂表格所有的欄位,以便透過各種途
徑進行分享。
由於守備數據總是有如二等公民般不被重視,我也決定在「Leaders」頁面中將守
備數據的排行也納入,每一個守備位置的 s/c/a/p/y 排名都可以查詢到。在聯盟
頁面導覽列的「Leaders&Awards[+]」之下點選「Fielding」,也可以查到該年或
大聯盟史上的領先群,如 Mike Piazza 史上最多的十次盜壘王等等。
範例:http://www.bbref.com/leaders/leaders-most-times-field.shtml
目前守備數據還沒有放進「Play Index」中,但只要時間允許,我希望在這個夏
天完成。希望你喜歡這項新功能,有任何批評指教歡迎來信。
7. Player Wins Above Replacement
http://www.baseball-reference.com/blog/archives/6063
Posted by Sean Forman on May 17, 2010
數據派總是在尋找衡量球員對勝利的貢獻的最佳方法,Baseball Prospectus 提出
WARP,Bill James 發明 Win Shares,現在我們的網站將提供 Sean Smith 的 WAR
(Win Above Replacement)。
以下是一些跟 WAR 數據資料相關的頁面:
* 生涯 WAR 領先榜:
http://www.bbref.com/leaders/WAR_career.shtml
* Albert Pujols、Ryan Howardand 和 Dwight Gooden 的逐年 WAR 資料:
http://www.bbref.com/players/p/pujolal01.shtml#batting_value
http://www.bbref.com/players/h/howarry01.shtml#batting_value
http://www.bbref.com/players/g/goodedw01.shtml#pitching_value
* 2009年國聯 WAR 領先榜
http://www.bbref.com/leagues/NL/2009-batting-leaders.shtml
* 1980年美聯所有球隊與球員的 WAR 紀錄
http://www.bbref.com/leagues/AL/1980-value-batting.shtml
* 2000-2009年,投手的 WAR 領先榜
http://www.bbref.com/pi/shareit/MxPPV
* 1990-1999年,游擊手的 WAR 領先榜
http://www.bbref.com/pi/shareit/Jg7KJ
* 1961-1981年,Runs from Baserunning(Rbaser)領先榜
http://www.bbref.com/pi/shareit/sSTqX
* 投手生涯最多次「單季 WAR > 6.0」的紀錄
http://www.bbref.com/pi/shareit/9kV3H
* 2001年水手隊球員的 Player Value
http://www.bbref.com/teams/SEA/2001.shtml#players_value_batting
我們將會把所有的 WAR 資料整合進整個網站中,有任何的問題或建議皆歡迎來信
指教。與 WAR 資料有關的計算中,所有的 Runs Values 資料都是與聯盟平均做
比較,我們已經將2010年資料的打者部份計算完成,投手的部份也很快就會更新。
(以下分別是打者和投手的各項 WAR 數據說明,有興趣的人請看原文)
8. Player Photos, pre-1960
http://www.baseball-reference.com/blog/archives/6284
Posted by Sean Forman on May 24, 2010
我的信箱中常常收到一些令人意想不到的新想法,並讓我認真考慮在網站上新增
這個功能的可行性有多少,David Davis 的郵件就是其中一封,他提供了一組很
大的檔案,裡面約有大聯盟歷史上 90% 左右球員的頭像照片;他也對檔案結構做
了很棒的整理,讓我在把檔案放上網站的過程可以相對輕鬆。
由於使用較新的照片容易產生著作權的問題,我們現在只提供在1960年之前初登
場的球員的照片。從A到Z,從 Cap Anson 到 Don Zimmer 都有照片,但目前還沒
有從 David Aardsma 到 Ryan Zimmerman 的照片,未來我也可能會處理這件事,
希望可以解決著作權的問題。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.112.118
推 Sechslee:頭推 07/12 14:48
推 becseger:頸推 07/12 16:04
推 albomxx: 奶推 07/12 16:24
推 YGJHSU:肋骨推 07/12 17:03
推 carrhung:橫膈膜推 07/12 17:08
推 forkome:毛推 07/12 22:46
> -------------------------------------------------------------------------- <
作者: Beisbol (Béisbol) 站內: MLB
標題: Re: BBRef網站成立十週年,推出十項新功能
時間: Mon Aug 2 02:36:58 2010
9. Gamelogs, Box Scores and Splits for 1920-Yesterday
http://www.bbref.com/blog/archives/7258
Posted by Sean Forman on July 13, 2010
感謝 RetroSheet 的無名英雄們的努力,我們現在有MLB從1920年至今每一場
比賽的 box score 和 gamelog,以及1950年至今的 play-by-play 資料;這
包含了大聯盟最近90年的歷史、超過15萬場比賽,等於是從1871年至今80%的
球季、74%的球隊球季,並包含了72%的球員的完整生涯。
這次我們補上的最大一塊拼圖,是1940-1951年的球季,所以你現在可以查詢
到:
* 1941年 Joe DiMaggio 的連續56場安打紀錄:
www.bbref.com/players/gl.cgi?t=b&n1=dimagjo01&year=1941#715-770-sum
* 1949年 Ted Williams 的連續84場上壘紀錄:
www.bbref.com/players/gl.cgi?t=b&n1=willite01&year=1949#1097-1180-sum
Play Index 現在也新增了這些球季的資料,且容我吹噓一下,我們從1950年
至今的 play-by-play 資料總共有超過900萬列,每一列資料有200個column,
也就是說資料庫中總共有18億筆的資料。打者的 gamelog總共有370萬列,
splits 表格則有610萬列,全部都可以搜尋。
由 Dave Smith 所領導的 RetroSheet 工作團隊完成了這項偉大的工作,再次
提醒,你可以在我們的網頁中查詢現有資料的完整度:
http://www.bbref.com/about/coverage.shtml
10. MLB Contracts, MLB Agent, Player Service Time, and Historical Salaries
http://www.baseball-reference.com/blog/archives/7628
Posted by Sean Forman on July 30, 2010
在交易截止日前夕,球員的合約是很重要的考量點之一;我們現在新增了許多
跟錢有關的資料,包括以下:
a. 球員合約:
在與 Fan-Exchange.com 的 Paul Riker 合作之下,我們有了幾乎每一位現役
球員的合約資料,在球員頁面最上面的基本資料之下,有他們的2011年合約狀
態、資歷年數、合約與選擇權概況、可仲裁與成為自由球員時間、所屬經紀人
等資料。
http://www.bbref.com/players/o/oswalro01.shtml
另外在球員頁面的最下方也新增了「Salaries」表格,所以你可以簡單的查到
球員未來幾年的合約內容、以及生涯至今的薪資總額。
http://www.bbref.com/players/o/oswalro01.shtml#contracts
在球隊的「Payroll, Roster & Uniforms」頁面中,也能看到大部分球員的合
約狀態,尤其是有長合約的球員資料更是完整。在這個表格下方,我們也盡量
去統計出球隊未來幾年的薪資總額,以及各種相關的可能支出。再次提醒,每
個表格上方的「SHARE」按鈕可以讓你自訂表格欄位,只將你需要的部份呈現
在你自己的blog或網頁中,如我文章中所做的例子所示。
http://www.bbref.com/teams/NYY/2010-roster.shtml
這些合約資料實在很難彙整與建構進資料庫中,故激勵條款和其他附加條件現
在都還沒有納入,但目前正在努力克服這個困難。資料來源除了 Paul Riker
的網站外,還有 Joint Exhibit One、Cot's Baseball Contracts、以及其他
的媒體資源。如果你要找更多的歷史合約資料,可以參考Cot的網站。我們會
持續的更新這些資料,但所有的來源都是非官方的,故如果發現有錯誤,請通
知我們更正。
http://mlbcontracts.blogspot.com/
b. 經紀人
我們嘗試將現任與過去的經紀人都列入,資料來源有 Will Young、Cot's
Contracts、媒體資源、以及經紀人本身;如果發現有錯誤,請通知我們更正。
c. 歷史薪資資料
由於與 SABR 的協議,我們現在取得了許多1985年以前的薪資資料,總共增加
了6268筆,且完整度非常高,如 Joe DiMaggio 和 Ted Williams 生涯大部分
的薪資資料:
http://www.bbref.com/players/d/dimagjo01.shtml#contracts
http://www.bbref.com/players/w/willite01.shtml#contracts
在1985年以前的球隊頁面中,只要我們有一筆以上的球員薪資資料,它就會顯
示在該隊的Roster頁面中。這些資料主要是由已過世的 Doug Pappas 所彙整
的,對對棒球經濟有興趣的人而言,至今仍是很重要的資料。
我所承諾的十項新功能終於完成了,但是別擔心,接下來的日子裡還會有許多
更新與改進,感謝你對 Baseball-Reference.com 的支持。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.117.180
→ catsondbs:推! 也推BR! 現在都很少再需要找其他網站真是太過份了XD 08/02 02:38
推 chien533:真希望有一天DL的資料也能放上去,但Retrosheet的人說很 08/02 03:45
→ chien533:困難/_\ 08/02 03:46
推 Belladonaa: 08/02 04:46
→ Vidic:推 08/02 07:52
推 ilovekebi:push! 08/02 09:52
推 Fanicom:推推~ 08/02 12:44
推 redsnipertd:賀 08/02 14:36
推 wu2183:推 真強 08/02 21:57