作者andrew43 (apan)
看板Statistics
標題[問題] 避免錯誤地合併資料
時間Mon Mar 25 22:52:16 2013
不洽當的合併資料, 諸如合併不同處理、不同類別、去除重要因子等,
在分析上容易引導錯誤結論,其中最著名的例子是 Simpson's paradax。
我想請問諸位版友的問題是,有效避免這項問題的操作性方法是什麼?
例如,在一個複雜的一般線性模型中,我將模型中不重要的自變數刪除。
在這個過程中,常見的例子是交互作用不重要拿掉、相關太低的自變數拿掉……
但我怎麼知道我真的只拿掉了和應變數沒瓜葛的變數呢?
不知道可否請板友提供一些操作性的判別方法?非常感謝。
(不然我常常吵不贏老闆啊……)
--
http://apansharing.blogspot.com/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.230.68.146
→ MIZUYAMA:因該說入門者要知道資料的形態吧 用is.XXXX之類的指令 03/25 23:10
→ yhliu:拿掉不重要的潛在解釋變數或效應項是必要的. 評估的標準就是 03/27 16:59
→ yhliu:被拿掉的確實不重要. 而要避免因忽略重要解釋變數或效應項而 03/27 17:00
→ yhliu:扭曲了事實, 要做的就是檢查、思考: 有沒有可能哪些解釋變數 03/27 17:01
→ yhliu:或效應項被忽略了? 這些問題, 就是線性模型(線性迴歸模型)以 03/27 17:02
→ yhliu:及其他統計模型之 "模型建構、選擇與診斷" 主題中所探討的. 03/27 17:03
→ andrew43:知道方向了,謝謝。 03/27 17:58