作者Vulpix (Sebastian)
看板Math
標題Re: [機統] 離均差的意義
時間Mon Jul 16 18:25:53 2012
※ 引述《qazzy76 (學億)》之銘言:
: 前幾天和朋友聊天聊到離均差和標準差的問題
: 有個疑惑想要請教大家(因為最後聊不出個結果哈哈)
: 離均差和標準差都是代表樣本的離散程度,可是兩個數值不一樣
: 那麼,是這兩個數在"離散程度"上所代表的意義或對"離散程度"的解釋有一些不同?
: 還是其中一個可以比較精確地代表樣本的離散程度?
: 因為個人對這個問題一直很有興趣,想要聽聽大家的意見:)
我想,"分散程度"本來就有很多種描述方法
(套一句葉乃裳教授常說的話:There's a Hilbert space out there.
當然此處不是真的有個Hilbert space,僅僅是個形容而已。)
以下兩筆50個學生的成績
1. 1個100分、1個0分、48個50分
2. 10個45分、10個55分、30個50分
離均差是一樣的,都是2,可是標準差不一樣
那我們怎麼想呢?兩筆資料的"分散程度"一樣嗎?還是不一樣呢?
其實這兩筆資料的"分散程度"無論如何都可以挑出"不一樣"的地方
(標準差、四分位距、全距都不一樣,抱歉...四分位距好像一樣XD)
此處產生的不方便我覺得只是
我們為了用一個單一標準(一個維度的量)來表示"分散程度"所做的讓步
在一個普通的歐氏空間,我們可以定義出很多個norm
這些norm都可以當成是一種"距離"來看待
那麼(1,1)與(2,0)哪一點離原點比較"遠"呢?
常用的2-norm告訴你是(2,0),但是1-norm卻說一樣遠...
端看我們想用哪個說法而已
我們描述一組資料的時候總是會說兩個數據
一個是資料的"代表量",一個是資料的"分散程度"
有個有趣的問題是:當"代表量"固定時,有沒有哪個"分散程度"是最"自然"的?
(當然也可以倒過來問,甚至問這個關係是不是能給出一個1-1對應)
譬如說,當我們選擇"代表量"是算術平均數的時候
"分散程度"應該用標準差會是最自然的
因為中央極限定理中,這兩個量是一起出現的
還有如果我們任選一個x當作平均數,那用這個平均數去計算的"標準差"裡面
x=算術平均數的時候,"標準差"是最小的
這些都可以當成是"自然"的一種說法
有點離題了...不過最主要要說的就是黃字的部分
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.7.214
推 Lpspace :歐式空間是Hilbert space 07/16 18:50
→ Lpspace :純粹來亂,這是篇好文(Y) 07/16 18:50
※ 編輯: Vulpix 來自: 140.112.7.214 (07/16 19:43)
推 TassTW :Hilber space 可以講多一點嗎 xD 07/16 21:16
推 Morphee :葉最近還有回來台大開場論嗎? 07/16 21:17
推 Lpspace :我的名字p改成2就是Hilbert space XDDDDDD 07/16 22:31
推 bohsing :推好文! 07/17 00:48
推 ariainaqua :帳號也太神了XDD 07/17 01:02
推 jetzake :...所以這帳號是"LP空間"的意思是嗎....= =A 07/17 03:13
推 TassTW :樓上, Lp space 卻有其物, 只不過台灣人讀來都會偷笑 07/17 04:50
推 itai :推~~~原po表達能力不錯!XD 07/17 10:40
推 qazzy76 :感謝賜教!!(慢慢消化中...) 07/17 20:47
推 jacky7987 :只好相當個Banach sp!? 07/18 01:57
→ jacky7987 : 先 07/18 01:57