※ 引述《zennage.bbs@ptt.cc (為什麼 )》之銘言:
> 在一般線性模型中
> y=b0+b1X+e_i
> 而我們對於誤差項(e_i)都會有一些基本假設
> 也就是
> 1.常數變異
> 2.期望值為0
> 3.彼此之間獨立
> 4.分配為常態分配
> 我的問題是,為什麼我們需要這些假設呢?假如沒有這些假設會怎麼樣?
> 以下是我的想法,不知道對不對
> 想要在這邊請教大家。
> 1.常數變異
> 在我們使用最小平方法估計迴歸線時,對於某些給定的x值,y的變異可能會非常大。
> 為了要控制此種狀況,我們必須要作加權(weight)的動作,對於變異大的加權少一些
> 而變異小的加權多一些,但是這些動作都會增加模型估計上的複雜度,為了讓模型估計
> 不要那麼複雜,我們通常都會假設誤差項是常數變異的,也就是說觀察點會合理的在迴歸
> 線附近一定的寬度內。
(1) 若誤差項有 "無相關" 加上 "變異數一致" 條件, 那
麼, 對於誤差項我們只需估計那共同變異數. 這樣推
導迴歸係數的估計量, 例如最小平方法或動差法, 比
較簡單.
(2) 若誤差項的上述假設不符, 仍然可以用普通最小平方
法估計迴歸係數, 但至少有兩個問題:
a) 這不是最好的估計: 不太貪心, 最小平方法希望在
迴歸係數的所有 "線性估計量" 中其結果是最好的;
但若上列假設不滿足, 用普通最小平方法得到的就
不是最好的.
b) 更嚴重的是: 我們對誤差的評估會錯誤, 對迴歸係
數更不能正確估計其誤差.
(3) 如果誤差項變異數不一致, 甚至誤差項間有相關, 必
須看究竟不一致或相關的型式而決定修正最小平方法,
如加權最小平方法, 一般化最小平方法, 或反覆重加
權等方式.
(以上 2005 的回答文字)
> 假如缺乏這個假設,在每個給定的\,$x$\,值之下,我們可能都要估計一個變異數,這樣
> 子所估計出來的模型可能既複雜又不準,在進行迴歸分析時將會非常困難。
誤差項變異數不一致不表示誤差項變異數一定隨 x 而變.
在相同 x 值的兩個 Y 的變異數可以不同.
> 2.期望值為0
> 會有這個假設的原因是因為我們希望沒有誤差,在重複進行測量並進行估計時,所得到
> 的點都會非常的接近迴歸線。
"沒有誤差" 是誤植吧? 應是 "沒有偏誤".
事實上, 若不假設 E[e_i]=0, 模型還有意義嗎?
> 3.彼此之間獨立
> 是為了避免資料之間彼此是互相影響的。ex:時間序列
"假設" 是對未確知之事實的假設,不可能用假設去限定事
實. 因此 "為了避免資料之間彼此是互相影響的" 說不通.
如所舉時間數列為例,難道能 "為了..." 而 "限定" 各期
資料相互獨立?
> 4.分配為常態分配
> 為了要求信賴區間
為了做統計推論 (不只 "求信賴區間"), 必須知道統計量
的分布. 因此需先知道資料的分布. 常態性假設是最好處
理, 而且在許多情況 (但非所有情況) 是合理的假設.
> 想請問各位,不知道我的想法是否有錯誤的地方。
> 感謝
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海