看板 Statistics 關於我們 聯絡資訊
關於 factor 與 dummy variables 的問題. 一個 k 分類的屬質變數(factor), 在應用複迴歸程序時, 需要建立 k-1 個虛擬變數來代表它。 例如: 屬質變數 "季節" 分四季: 春/夏/秋/冬, 季 節 虛擬變數 春 夏 秋 冬 X1 1 0 0 0 X2 0 1 0 0 X3 0 0 1 0 以上是以 "冬" 為 baseline, 因此 X1, X2, X3 的係數, 分別代表對應類別(春/夏/秋)相對於 baseline category "冬" 的差異。 一般做 ANOVA 模型時, factor 的各 level (category) 有各自的 effect 參數, 但這些參數若未加限制條件則是 不可估的 (所以 general linear model 中會談甚麼參數 函數可估的問題). 一個廣泛採用的限制是: sum to zero. 這相當於定義下列 dummy variables 用於迴歸模型: Effect coding 春 夏 秋 冬 Z1 1 0 0 -1 Z2 0 1 0 -1 Z3 0 0 1 -1 迴歸模型上列 dummy variables 的方法是另一限制:某一 level 的 effect 設定為 0. 設為 0 就是比較的 baseline, 一般迴歸分析中以 indicator 為 dummy variable, 如前 述 X1, X2, X3, 是以 baseline category 為比較基準; ANOVA 採 sum to zero, 就是以 "平均" 為比較基準。 以上, 參見 telnet://bbs.wretch.cc 的 Statistics 版 2003.11.28 "屬質變數與虛擬變數" 討論串. -- 來自統計專業的召喚... 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 批踢踢實業站 telnet://ptt.twbbs.org Statistics (統計學及統計軟體版) -- ▄▄▄▄▄▄▄ ▄▄▄▄ ▄▄▄▄▄▄ <telnet://bbs.cs.nctu.edu.tw> █▄▄▄▄█ █ ▄▄▄▄▄█ Player: yhliu ▄█▄▄▄▄█ ▄▄▄█ █▄▄▄▄▄ From: 163.15.188.87 ☆ 次世代BS2 ☆ 可申請個人板 150MB 超大相簿 http://pic.bs2.to 資訊人 250MB