→ erudition:咕咕咕....標題好可怕.......@@ 推 61.71.2.227 05/27
Q1. corr是interval層次才能作的嗎,因為不是每次作 reg . dummy . anova都要先作corr嗎?
Ans: 不可以說 "每次作 regression, dummy variable regression, anova都要先作corr",只能說在做因果模型分析(如regression, anova)前應先確定自變數與應變數間存有相關,用什麼方法來驗證相關?要看變數的性質。不管做regression 或anova,應變數都是interval level;自變數若為interval,就做proc corr,若是屬性變數就做proc ttest或其他方法。
proc corr 的確是只適用於interval variables。做regression之前我們會透過proc corr進一步了解變數間的關係。
但是dummy variable regression 是一種特殊的regression,通常我們不會用proc corr去確定兩者間是否有相關,我們可以透過t-test去驗證,或直接用simple dummy variable regression.
假設我以sex (dummy variable, 1=male, 0=female)及income(interval level)來解釋life satisfaction (interval level,簡稱Y)。我首先以proc corr 來驗證income and Y間的相關, 用proc polt來顯示兩者間是否有線性關係。其次, 我可以用proc ttest來了解male and female 的平均值是否有顯著不同 (或者我也可以直接先做dummy variable regression,亦即只放sex 進去做迴歸,顯著就表示sex對y有影響)。
(註:也有人直接將sex與Y 做proc corr。 若相關為正,表示男的Y平均值高於女的;若相關為負,表示女的Y平均值高於男的(因為男的以1代,女的以0代)。理論上不可以把sex拿去做相關,但若目的只在確知sex與Y 是否有相關存在,還是可以偷偷的做,做出來的結果一定會與proc ttest,或 proc reg; model y=sex; 相同)。
ANOVA適用於Y變數為interval,而自變數為屬性的,我們可以proc ttest來驗證其間的關係。
假設我以religion (P=基督教,B=佛教,M=回教,N= 其他)及sex (1=male, 0=female)來解釋y。為了確定religion 與y的關係是否存在我可以先做簡單的ANOVA, 即先做proc anova; class religion; model Y=religion;接著確定sex與y的關係, 做proc anova; class sex; model Y=sex. 最後再做proc anova; class religion sex; model Y=religion sex;
Q2. reg是變數皆為連續變數才作的 anova .dummy 是自變數是nominal 應變數是interval作的嗎? 那我們在作題目前是否就看變數的層次來決定用哪一種 方法來做,就可以了嗎?
Ans: 是的。
Q3.在解釋報表時,只要看f值(模型好不好) 和t值(可否推論到母體)再加上一些社會學解釋就可以了嗎?
Ans: 是的。
R2 值表示模型對應變數的解釋力,f 值用來確定R2 是否可推論到母體;迴歸係數(regression coefficients)用來說明自變數與應變數的關係(e.g. 做multiple regression model時,我們說 "當其他不變時,income 每增加一個單位,Y平均增加/減少x個單位"),regression coefficient 是否可推論到母體要看t值, 若t值太小就無法推論到母體; 換句話說我們無法肯到底在母體中income and Y 的關係是真的還是假的。在simple regression 中R2的顯著與否一定會與regression coefficient的顯著與否一致。但在multiple regression 中就不一定了。
Q4.若f值未達顯著,表示model不好,那R2(平方)是不是就沒有意義了,它還可以解釋母體嗎?那t值是否也是沒意 義了?
Ans: 請參考Q3.
--
※ 發信站: 批踢踢實業坊(ptt.csie.ntu.edu.tw)
◆ From: 211.74.12.105