[問題] 避免錯誤地合併資料

作者andrew43 (apan)

看板Statistics

標題[問題] 避免錯誤地合併資料

時間Mon Mar 25 22:52:16 2013

不洽當的合併資料, 諸如合併不同處理、不同類別、去除重要因子等，在分析上容易引導錯誤結論，其中最著名的例子是 Simpson's paradax。我想請問諸位版友的問題是，有效避免這項問題的操作性方法是什麼？例如，在一個複雜的一般線性模型中，我將模型中不重要的自變數刪除。在這個過程中，常見的例子是交互作用不重要拿掉、相關太低的自變數拿掉…… 但我怎麼知道我真的只拿掉了和應變數沒瓜葛的變數呢？不知道可否請板友提供一些操作性的判別方法？非常感謝。（不然我常常吵不贏老闆啊……） -- http://apansharing.blogspot.com/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.230.68.146

→ MIZUYAMA:因該說入門者要知道資料的形態吧用is.XXXX之類的指令 03/25 23:10

→ yhliu:拿掉不重要的潛在解釋變數或效應項是必要的. 評估的標準就是 03/27 16:59

→ yhliu:被拿掉的確實不重要. 而要避免因忽略重要解釋變數或效應項而 03/27 17:00

→ yhliu:扭曲了事實, 要做的就是檢查、思考: 有沒有可能哪些解釋變數 03/27 17:01

→ yhliu:或效應項被忽略了? 這些問題, 就是線性模型(線性迴歸模型)以 03/27 17:02

→ yhliu:及其他統計模型之 "模型建構、選擇與診斷" 主題中所探討的. 03/27 17:03

→ andrew43:知道方向了，謝謝。 03/27 17:58