作者sandra80032 (頻語兒)
看板NobuOnline
標題Re: [嘴砲]關於沉默二三事
時間Sun Oct 26 18:07:17 2008
回應這篇,我只是想對「命中率試驗」來做個回應。
因為推文裡說不清楚,所以另發一篇。其實這篇跟沉默本身沒什麼關係 XD
※ 引述《Hughgland (阿修修)》之銘言:
: 因為我自己沒去做實驗,所以用【嘴砲】當標題,以下內容不是絕對,歡迎大家分享經驗
: 和指正。
: 【沉默】<<<<<目前能確定的是和智力相關,但相關程度多少,以及是否有其它能力影響,
: 一直都眾說紛紜。
: 這裡先提供朋友藥師(A)某次和武士(B)的試裝結果。
: (因為是聽聞,確切數據可能有誤差,請大家參考一下)
: A的能力:1.智41X 2.智5XX
: B的能力:智40X魅40X
: 據說A的魅力不管哪種裝都差B約20。
: 結果=>1.被沉默率約7成 2.被沉默率不到5成
: 雖然到底測試幾次不清楚,但這結果其實能夠說明的不只是真的沉默與智力是正相關,
: 更重要的應該是:【沉默】是種機率性技能,不管怎樣都不太可能有所謂必中或必不中。
: 於是乎【沉默】有智力適性值或是不用把智力撐太高的說法(?)
有牽涉到「命中率」相關的東西,實測上比較辛苦。
並不是說無法測試,
而是要取樣的次數相當多,你才能證明智41X跟智5XX有「顯著差異」。
取樣次數的多寡相當相當重要,
所以做實驗的人要相當的有耐心 XD
(先說,我對願意做這測試的人是很有敬意的,不是惡意想批判 >"<)
因為我們不知道這個實驗的人到底實驗幾次,那我們就假設20次、50次來看看!
1.假設各做20次:
智410:沉中10次(五成)
智500:沉中14次(七成)
然後有人下結論說「智410跟智500使用沉默的命中率有顯著差異!」
→這個結論的可信度只有0.8
2.假設各做50次
智410:沉中25次(五成)
智500:沉中35次(七成)
然後有人下結論說「智410跟智500使用沉默的命中率有顯著差異!」
→這個結論的可信度有0.959
習慣上,結論的可信度要高達0.95才能算是有說服力的實驗。
也就是說大概要各做50次(兩組共100次),才算是有說服力。
不過玩個遊戲而已,也許不用那麼嚴謹,
大概取35次(兩組共70次)就OK了,35次的可信度是0.91。
(至於可信度是怎麼計算的我就略過不寫了,
欲知詳情,請翻你的統計學課本,假說檢定^_<)
如果原文中的那位武士,是各做超過35次以上的實驗,然後得到5成、7成這個結果的話,
那我會相信智410跟智500真的有差 XD
不過請注意,以上的檢定只是檢定「智410跟智500使用沉默有無顯著差異」
只是證明有差,可是還是不能證明差多少喔! (絕對不是7成-5成=2成喔 XD)
如果想證明智410跟智500的沉默率有差1成的話,大概各要實驗1~200次左右吧!
(也就是武士一共要沉200~400次)
所以有關命中率的技能很少人實測就是這樣,
想要做到高可信度,實驗次數用"百次"來做單位的,費時又費力。
取樣次數不足,實驗結果就很容易被大家懷疑。
很少人想做這種吃力又不討好的事情 XD
-------
我之前有個大計畫,想作工匠靈巧裝VS非工匠靈巧裝,生產上的差異。
因為工匠裝從破天時代就有了,
可是確切效果卻到現在都還沒有個定論。
我是爭霸才回鍋的,想爬文找有關工匠裝的文章,
結果資料卻少得可憐,而且一切都只是大家的猜測,沒有人正式實驗過 >"<
所以想自己實驗看看...
不過想歸想,一想到要先花大把銀子把我的工匠裝搞好就...Orz
嗯...等我以後有閒再說、有錢再說 (遠目)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.182.183
推 mimi9126:測半天,哪天工程師心血來潮改一個位元就全報廢了= =a 10/26 18:10
→ sandra80032:還是有用啊 先測數據放起來 等哪天大家懷疑機率被改 10/26 18:12
→ sandra80032:就再測一次 然後就可以PO [黑特] 死闇榮偷改機率! 10/26 18:12
→ sandra80032:要不然很多人常常懷疑某某機率被改 PO文上巴X說被改了 10/26 18:14
→ sandra80032:下面的回文就是"你運氣不好啦"vs"真的耶有被改"loop 10/26 18:14
→ sandra80032:結果到底有沒有被改沒人知道 因為從來就沒有人測過 XD 10/26 18:15
→ sandra80032:不過一樓說的也是大家懶得測的原因之一啦 XD 10/26 18:17
推 sunrise2003:測這種機率性的東西 我認為樣本數的多寡真的很關鍵 10/26 22:44
→ sunrise2003:雖然統計上 有30次的樣本就會被認為是可信的 10/26 22:44
檢定機率的狀況比較特別
在統計上,通常要100次以上的大樣本才能作分析...
不像平均值,只要實驗20~30次就好
所以我才說命中率相關的測試挺麻煩的
我內文中說的50次、35次,其實嚴格來講算是不行的
只是因為遊戲而已,所以降低標準一點 XD
→ sunrise2003:但是測一千次的結果 就算條件A比條件B多成功50次 10/26 22:45
→ sunrise2003:還是很難讓人認為A比B多了5%的成功率吧..... 10/26 22:46
確實是沒有辦法 就算做一千次 而A條件比B條件多50次
統計上也只能指出他們有"差異"
而不能說出「A條件比B條件多5%」 (這樣的結論絕對是錯的)
實際上想測出剛好多5%還蠻難的 XD
※ 編輯: sandra80032 來自: 140.113.182.183 (10/26 23:47)
→ Hughgland:題外話,原PO是把沉默和被沉的人看錯了嗎0.0? 10/27 00:04
→ sandra80032:哦 對 我看錯了 XD 我還想說武士智500真神 10/27 00:16