[問題] 檢定殘差不呈常態

作者amberclover (年紀大了就是這樣)

看板Statistics

標題[問題] 檢定殘差不呈常態

時間Sat Nov 18 01:46:02 2023

在做正式分析前,我想先檢測資料是否符合迴歸分析的基本假設如果我判讀沒錯,目前資料符合下面假設 1.自變項與依變項呈線性 2.殘差保持獨立性 3.殘差呈同質性但是殘差的常態檢定沒有過,呈現顯著上網找了很久,沒有找到殘差非常態時該如何處理 (已用k-s檢定樣本呈常態分配) 請問有比較建議的處理方式嗎? 或是我在哪可以找到說明or教學? 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.20.146 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1700243165.A.20D.html

→ locka: 好奇問個，有可能殘差獨立卻非常態嗎？ 11/18 02:26

→ yhliu: 當然可能誤差項非常態。（不是殘差，但誤差項是不可觀測的 11/18 07:31

→ yhliu: 只能用觀測到的殘差代替。不過，殘差其實相互有負相關及變 11/18 07:33

→ yhliu: 異數不等的問題。）檢定常態性，是把殘差當誤差來看待，用 11/18 07:35

→ yhliu: q-q plot 觀察，或做 W 檢定，或 K-S 檢定。 11/18 07:37

→ yhliu: 對於誤差項非常態分布的處理：如果是線性模型（迴歸模型） 11/18 07:38

→ yhliu: 如果樣本數相當大，可以引用中央極限定理於迴歸係數的推論, 11/18 07:40

→ yhliu: 或者針對其真正的分布導出 MLE 及迴歸係數之推論。迴歸模型 11/18 07:42

→ yhliu: 之比較也是迴歸係數推論。廣義線性模型(link=identity)即是 11/18 07:44

→ yhliu: 採用的是最大概似估計及概度比檢定。但如果只知非常態而不 11/18 07:46

→ yhliu: 知正確分布，又不想用普通最小平方法，那可能需要用非參數 11/18 07:48

→ yhliu: 化方法，也就是無母數方法。 11/18 07:49

推 a22735557: 除非違反的很誇張，例如skewness kurtosis 差很多或是 11/18 08:50

→ a22735557: 不明顯滿足empirical rule，不然通常還好，原因同樓上 11/18 08:50

→ a22735557: 大大說的，residual 本身其實變異數就不同質等等 11/18 08:50

→ a22735557: 我是建議不要用K-S直接下結論，因為這個檢定其實蠻難 11/18 08:52

→ a22735557: 不顯著的，他的要求很嚴格，差一點點就可能會不顯著 11/18 08:52

→ locka: 感謝2樓大大說明！我知道殘差(亦或誤差)是可能非常態分佈， 11/18 09:48

→ locka: 但想問的是殘差有可能在「已知獨立」的情況下但卻「非常態 11/18 09:48

→ locka: 」嗎？(以前都以為只要獨立就一定會是常態分佈…)有點想不 11/18 09:48

→ locka: 明白，再請大大解惑，謝謝>"< 11/18 09:48

→ amberclover: 感謝大大說明,為了這個超級煩惱. 再次感謝 11/18 10:17

→ Pieteacher: Boxcox transform 11/18 19:40

→ yhliu: 比如說 logistic 迴歸，Poisson 迴歸，前者每個觀測值不是 11/19 09:33

→ yhliu: 0 就是 1, 後者觀測值是計數資料，與迴歸曲線之間就群體模 11/19 09:35

→ yhliu: 型而言有誤差，就樣本值而言有殘差。殘差因為迴歸線就是這 11/19 09:36

→ yhliu: 些資料去 fit 的，所以相互有相關；誤差則是觀測值與群體迴 11/19 09:38

→ yhliu: 歸函數之間的差，觀測值相互獨立，誤差只是各觀測值減去一 11/19 09:40

→ yhliu: 個理論上的期望值，當然還是相互獨立，但這些誤差怎麼可能 11/19 09:42

→ yhliu: 常態分布？更別說要假設它們是 i.i.d. 常態。事實上如線性 11/19 09:43

→ yhliu: 模型的 "誤差是 i.i.d. 常態" 只是一個分析者設立模型時的 11/19 09:45

→ yhliu: 假設，這假設是否為真有時候需要檢驗，這就是殘差分析的項 11/19 09:46

→ yhliu: 目之一。殘差是群體模型誤差項的替代或估計，因此從各種殘 11/19 09:48

→ yhliu: 差圖可以看出很多東西，如迴歸函數適當否？誤差變四是否為 11/19 09:50

→ yhliu: 常數？誤差項是否符合原假設的常態？有沒有離群點？是否有 11/19 09:51

→ yhliu: 些影響點需要特別注意。關於誤差常態性的檢查，通常看 qq圖 11/19 09:53

→ yhliu: W 檢定與 qq圖密切關聯，至於 S-K 檢定，其實它比較適合用 11/19 09:55

→ yhliu: 在不需估計參數的資料，Box-Cox 轉換雖然可能改善誤差項的 11/19 09:56

→ yhliu: 態使其較趨對稱也較接近常態，但也改變了迴歸函數式及相加 11/19 09:58

→ yhliu: 性結構，但如果樣本不是太小，殘差顯示誤差項分布不是太偏 11/19 10:01

→ yhliu: 則關於迴歸係數的推論，t 程序，F 程序就不用太擔心。 11/19 10:02

→ yhliu: 前面誤差項變異數打成誤差變四 . 11/19 10:06

推 locka: 謝謝yhliu大大！非常清楚！！ 11/19 11:47