推 fu303:這完全沒有機率大或小的問題 因為現實中根本不可能發生 01/11 12:22
→ fu303:現實中不可能發生的事模擬出來就是有問題 不是說個什麼樣本 01/11 12:23
以上不予討論, 基本上我們已經知道你統計沒學好了...
→ birdy590:這樣的模擬沒有意義, 一切條件都應該設定成"正常狀態" 01/11 14:13
→ birdy590:再厲害的電腦也算不出投手/打者會不會突然肚子痛失常 01/11 14:13
→ birdy590:但是在這一系列模擬裡面有太多莫名其妙的"場面"發生 01/11 14:14
→ birdy590:這種東西不去除, 做出來的跟 MVP Baseball 有什麼兩樣? 01/11 14:15
simulation 時一定會丟 noise 進去的!
→ birdy590:我的意思是, 像天氣好壞、投手打者有沒有拉肚子這種事情 01/11 18:36
→ birdy590:無法控制因素就不應該列入考慮, 硬加進去反而會污染結果 01/11 18:38
→ birdy590:現在只做了四場就場場都有怪事, 通常代表 model 就有問題 01/11 18:39
→ birdy590:例如說 221 局從未出現過的狀況就屬不正常 01/11 19:02
→ birdy590:投手球季最後兩個月 ERA 只有 2+ 卻莫名其妙就爆也不正常 01/11 19:03
→ birdy590:這種結果跟 MVP 隨便跑跑的差不到哪去, 看不出哪裡比較好 01/11 19:06
做這種模擬時要區別出 abnormal 跟 random 有點難
這種結果就是拿轉換數據去跑出來的第一個估計值罷了!
just fun
--
「想說就快說,不要浪費篇幅。」
「事情就是這樣。」
「這不是節省篇幅的方法。」
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.145.88
→ HysTakuya:好夢幻的ID 01/12 11:18
推 lovejeely:原po最近很紅...(茶) 01/12 12:26
→ greengreen42:基本上不會統計的人 跟他談數據他是無法懂的XD 01/12 13:51
推 bluedoll:現實生活甚麼都有可能發生,都有人能把球頂出全壘打牆了 01/12 14:02
→ bluedoll:把極端值去除就會是一個比現在更能夠信服的model? 01/12 14:04
→ birdy590:現實生活當然什麼都可能發生, 但是這些無法預期的狀況 01/12 15:52
→ birdy590:你怎麼知道他是一百場一次還是一千場一次? 01/12 15:52
→ birdy590:把它假設成不會發生(至少在這個 series 裡面不會發生) 01/12 15:53
→ birdy590:才可能得到接近實際狀況的答案 01/12 15:53
→ CGary:不對吧?..假定成不會發生會沒辦法模擬到怪事...分佈好好設計 01/12 16:29
→ CGary:才是重點...所以那個Random number gen才是問題,就如s兄說的 01/12 16:30
→ CGary::想出個豹子,也不過是作者的電腦高興而已....:X 01/12 16:30
推 foudre:作者應該不可能動得了亂數產生器,而一般人玩DMB也沒有這種 01/12 18:17
→ foudre:怪問題這麼誇張,我猜是human tampering,也就是說他其實模 01/12 18:19
→ foudre:擬了好幾場,然後挑一場他覺得最值得發揮的來些,所以就出 01/12 18:20
→ foudre:現了bias。 01/12 18:21
推 H2:嗯嗯, 作者為了新聞效果而在模擬樣本上作篩選的確是有可能 01/12 18:30