看板 Statistics 關於我們 聯絡資訊
不洽當的合併資料, 諸如合併不同處理、不同類別、去除重要因子等, 在分析上容易引導錯誤結論,其中最著名的例子是 Simpson's paradax。 我想請問諸位版友的問題是,有效避免這項問題的操作性方法是什麼? 例如,在一個複雜的一般線性模型中,我將模型中不重要的自變數刪除。 在這個過程中,常見的例子是交互作用不重要拿掉、相關太低的自變數拿掉…… 但我怎麼知道我真的只拿掉了和應變數沒瓜葛的變數呢? 不知道可否請板友提供一些操作性的判別方法?非常感謝。 (不然我常常吵不贏老闆啊……) -- http://apansharing.blogspot.com/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.230.68.146
MIZUYAMA:因該說入門者要知道資料的形態吧 用is.XXXX之類的指令 03/25 23:10
yhliu:拿掉不重要的潛在解釋變數或效應項是必要的. 評估的標準就是 03/27 16:59
yhliu:被拿掉的確實不重要. 而要避免因忽略重要解釋變數或效應項而 03/27 17:00
yhliu:扭曲了事實, 要做的就是檢查、思考: 有沒有可能哪些解釋變數 03/27 17:01
yhliu:或效應項被忽略了? 這些問題, 就是線性模型(線性迴歸模型)以 03/27 17:02
yhliu:及其他統計模型之 "模型建構、選擇與診斷" 主題中所探討的. 03/27 17:03
andrew43:知道方向了,謝謝。 03/27 17:58