→ andrew43:第一種方法很常見,但要小心它是非正交對比。 01/11 05:39
→ andrew43:第二種方法的alpha會澎漲,於是p-value就不宜參考了。 01/11 05:41
→ andrew43:我從來沒有看過用第二種方法的。不知道你哪裡看到的? 01/11 05:42
→ andrew43:第一種方法你可以查 simple contrast 得到更多資料。 01/11 05:42
→ andrew43:以上回答你第一個問題。 01/11 05:43
→ andrew43:第二個問題比較複雜,但至少和dummy variable無關。 01/11 05:44
→ andrew43:要不要採用某個因子是全有全無的,所以先不用想dummy。 01/11 05:45
→ andrew43:先檢驗某因子的邊際效果,而不要直接就看到dummy裡去。 01/11 05:46
→ andrew43:另外,都不考慮交互作用嗎?你可能要想一想。 01/11 05:50
→ BugEater:Dummy variables,將水準數減一的原因是什么呢? 01/11 06:23
→ BugEater:是因為reference category的effect是表現在intercept那里 01/11 06:23
→ BugEater:所以需要減1。如果你的model沒有intercept這一項,那么 01/11 06:25
→ BugEater:你就要包括所有的水準數,當然coefficient的解釋就不同了 01/11 06:25
→ BugEater:對第二個問題,放背景變量的目的是進行一定的control, 01/11 06:27
→ BugEater:如果背景變項可能沒有effect,那么你可以認為無須control 01/11 06:29
→ BugEater:所以放不放要取決于你的研究hypothesis是如何表述的 01/11 06:31
推 andrew43:BugEater說的沒錯。我倒沒想過你可能沒有截距項。 01/11 07:18
→ andrew43:但如果超過一個因子在模型裡,那也只有一個因子能這樣做 01/11 07:24
→ andrew43:而且沒有截距項在解釋上往往有困難,且檢驗的H0也不同。 01/11 07:26
推 BugEater:是,當多于一個因子時候會變復雜,用dummy就好。 01/11 08:06
→ chanmer:感謝各位大大 雖然小弟功力尚淺 但是獲益良多 有了指點 01/11 14:51
→ chanmer:大概有了些頭緒 像TWO-WAY ANOVA等 真的很謝謝大家解惑 01/11 14:52
→ yhliu:第一種方法就是4組只取3個 dummy, 第2種方法是有幾組就取幾 01/11 21:00
→ yhliu:個 dummy. 第2法的4個 dummy 加起來是常數 1, 也就是說會和 01/11 21:01
→ yhliu:常數項重疊, 或術語說是 "完全線性重合". 因此, 類別變數取 01/11 21:02
→ yhliu:dummy 時是少一個, 也就是第1法. 01/11 21:02
→ yhliu:第2個問題基本上是模型選擇問題. 與簡單數值變數不同的是: 01/11 21:03
→ yhliu:一個類別解釋變數對應多個 dummy, 因此在利用軟體執行時需要 01/11 21:04
→ yhliu:該軟體能直接處理類別解釋變數. 像這樣的軟體通常也會自動建 01/11 21:05
→ yhliu:立虛擬變數. 01/11 21:06