→ Pieteacher: CLT 不是只有樣本大的條件, 還有moment的一些條件 03/01 12:15
→ Pieteacher: 雖然不好 verify, 要就事做無母數 不然就透過轉換 03/01 12:15
→ Pieteacher: 讓他像 normal 一點 03/01 12:15
推 celestialgod: CLT是對平均值的分配 而非觀察值.... 03/01 20:02
推 Vulpix: 觀察值不常態很正常啊。成績、身高、體重這些沒有一個會是 03/02 01:06
→ Vulpix: 真正的常態,因為這些常見的數據都沒有負的。 03/02 01:07
→ celestialgod: 沒有負的就不是常態也不太對.... 03/02 21:23
→ celestialgod: 身高平均175 標準差5的話 <0的機率.... 03/02 21:23
→ celestialgod: 觀察值不是常態 有兩個方向可以解釋 03/02 21:24
→ celestialgod: 第一個他可能是mixture常態 要找到關鍵變因切割 03/02 21:24
→ celestialgod: 像是男女生的身高分布不同,放在一起不可能是常態 03/02 21:25
→ celestialgod: 另一個就是它本身就不是出自常態分配 03/02 21:26
→ celestialgod: 另外,樓主的常態性檢定 有沒有想過 03/02 21:27
→ celestialgod: 樣本大的時候power跟樣本大小的關係 03/02 21:28
→ celestialgod: 樣本大的時候,檢定力高,只要有一點點不同就會 03/02 21:29
→ celestialgod: 拒絕虛無假設 03/02 21:29
→ celestialgod: 建議原PO畫畫看QQ-plot 看看圖形來判斷跟常態差異 03/02 21:29
→ celestialgod: 有多大 03/02 21:29
→ celestialgod: 看原始值跟對角線差異在哪 03/02 21:31
→ celestialgod: 原始值尾巴小於對角線 就是尾巴部分比較短 03/02 21:31
→ celestialgod: 相反就是尾巴分布長 03/02 21:32
→ celestialgod: 兩種會有不同樣的做法做轉換 03/02 21:32
→ celestialgod: 第三種就是主體偏離對角線,這種通常就沒救了 03/02 21:32
→ yhliu: 5000筆資料如果能分布得像常態才怪哩! 而所謂 "基於常態分 03/07 03:53
→ yhliu: 布的統計方法", 又一稱呼是 "大樣本的統計方法". n=5000 勉 03/07 03:55
→ yhliu: 強可稱之為大樣本了吧? (廢話, 人家 n=30 都叫大樣本了!) 03/07 03:57
→ yhliu: 不過, 其實也不是這麼看的, 應該先問是要做什麼分析, 從子 03/07 04:00
→ yhliu: 樣本來看是否適用大樣本的統計方法. 總不能5000筆資料分割 03/07 04:04
→ yhliu: 成數百組相互比較還說是大樣本吧? 也不能近5000筆一組與十 03/07 04:06
→ yhliu: 幾筆一組的相比較還說是大樣本吧? 以比較平均數為例 (既然 03/07 04:08
→ yhliu: 提到 t 檢定, 辜且認為是比較平均數吧.) 是否適用大樣本方 03/07 04:10
→ yhliu: 法, 看的是分組後各組是否子樣本的分布長得像來自常態群體 03/07 04:12
→ yhliu: (別指望真的來自常態群體, 大概像常態就可以了.) 其次看樣 03/07 04:14
→ yhliu: 本數最小那一組是否足以引用中央極限定理 (也就是能否稱是 03/07 04:16
→ yhliu: 大樣本). 以 t 檢定的穩健性, 除非子樣本特小或樣本分布的 03/07 04:18
→ yhliu: 形態特偏, 否則適用 t 檢定大多是沒問題的. 03/07 04:21
推 evilove: 我只是要推一下久不見的老怪物帳號 :) 03/09 01:14
→ sjgc5e1p9r: 我印象中CLT指的是樣本平均會收斂到常態分配,你這裡 05/02 12:50
→ sjgc5e1p9r: 是指樣本"平均"嗎? 05/02 12:50