看板 Statistics 關於我們 聯絡資訊
目前知道在箱型圖中,outlier是利用Q3+1.5*IQR, Q3+3*IQR, Q1-1.5*IQR, Q1-3*IQR這 些內限外限決定出來的,那想了解這四個值為什麼要這樣定義(ex:為何不是Q3+2*IQR等等 之類的…)?是有什麼理論依據或是經驗法則?煩請各位大哥大姐解惑~謝謝。 如果是跟統計軟體有關請重發文章,使用程式做為分類。 統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,擅用E做檔案編輯 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.173.108 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1508986308.A.D13.html
celestialgod: When John Tukey was inventing the box-and- 10/26 19:03
celestialgod: whisker plot in 1977 to display these values, 10/26 19:04
celestialgod: he picked 1.5×IQR as the demarkation line for 10/26 19:04
celestialgod: outliers. This has worked well, so we've 10/26 19:04
celestialgod: continued using that value ever since. 10/26 19:04
celestialgod: 不過從標準常態想,就是2.7個標準差 10/26 19:05
celestialgod: 掉出去的機率只有 0.7%左右 10/26 19:05
j7874110: 感謝C大提供此資訊。 10/27 11:53