看板 Statistics 關於我們 聯絡資訊
※ 引述《yhliu (老怪物)》之銘言: > ※ 引述《[email protected] (軒玥)》之銘言: > > 假設N表示資料的數目,K為組數。 > > 1.K=√N。 > > 2.K=1+3.322xlog(N)。 > > 3.經驗法則,決定K。 > > 請問,除了這三種方法之外,還有其它的公式或方法嗎? > > 如果有人知道可以參考的書籍書名,可以麻煩提供一下嗎? > > 謝謝~~ > 就個人觀點, 根本無需理會那些公式! > 倒不如去思考分成幾組大概可看出分布的模樣. 關於公式: 組數 = 1+log(n)/log(2) = 1+3.22log(n), 經查證, 稱為 Sturges' rule, 是 Sturges (1926) 發表 於 JASA, V.21, pp.65-66. Sturges 是立基於對稱二項分布近似常態分布, 而取每一 組次數 C(k-1,j), j=0,1,...,k-1. 但為甚麼要取 C(k-1,j) 為組次數, 而不是 m*C(k-1,j)? 因為 C(k-1,j) 與對稱二項分布機率成比例, 而乘一個常 數 m 仍然一樣. 結果變成 組數 = 1+log(n/m)/log(2) = 1+3.22log(n/m). 除了 Sturges' rule, 最受廣泛注意的大概是 Scott(1979) 發表於 Biometrika, V.66, pp.605–610 的公式 組距(h)=3.5s/n^{1/3}, s = standard deviation 是要使 AMISE 最小的組距. 這也是在常態分布下導出的; 但它仍然有弱點被批評 (例如 Wand (1997), AMS, V.51, pp.59-64.) Freedman and Diaconis (1981) 提出 h=2(IQR)/n^{1/3}, 以四分位距取代標準差. 若資料近常態, 這組距比 Scott 的小, 大約是80%. 不過似乎較少被提到? 以上資料主要參考 Hyndman1, Rob J. (1995) The problem with Sturges' rule for constructing histograms. http://www-personal.buseco.monash.edu.au/~hyndman/papers/sturges.pdf 雖然花更多時間的是雜亂未記錄整理而無法在此提及的搜 尋結果. -- H E L P !!! 統 計 專 業 版 需 要 你 !!! 來 貼 文 吧 !!! 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) ★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。 -- 夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子 之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下 矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以 喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫 之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87