看板 Statistics 關於我們 聯絡資訊
請問如果是類別變數的話 也可以利用C大提到的模型嗎? 將變數做centering 謝謝~ ※ 引述《coldwind0912 (隨風而逝~)》之銘言: : → bmka:y大, 那你最好檢查一下你的程式 10/09 19:44 : → bmka:sorry, 是 c大 10/09 19:45 : → bmka:BTW, 我的建議是 X1,X2,X1*X2各自做centering,不是只有X1X2做 10/09 19:47 : → bmka:其實想法很簡單, 就是利用centering去處理collinearity(笑) 10/09 19:55 : → bmka:(假裝不知道它們之間的關係),不過,這只能避免一點計算上的 10/09 20:24 : → bmka:小小問題...好處是除了截距項外其他係數不會變 10/09 20:31 : 我想 既然b大有那麼多種的想法 又要追求嚴謹 : 只好以我之前一份已經發表的paper裡的data 來檢驗各種在這個討論串曾提及的模型 : 以進一步驗證 哪些意見是正確的 哪些意見是不嚴謹的 : Model1:Y=b0+b1X1r+b2X2r+b3(X1r*X2r)+a (完全不調整資料的原始模形) : b值 標準誤 bata值 t值 顯著性 允差 VIF : 截距 4.227 1.200 3.522 .001 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : X1r*X2r .117 .050 .804 2.333 .020 .027 37.699 : 基本上,在不調整任何資料型態的時候,在迴歸模式中,置入交互作用項 : 一定會導致共線性過高的問題,所估計之參數結果應該也是有偏誤的。 : Model2:Y=b0+b1X1r+b2X2r+b3(X1c*X2c)+a : (自變項不centering,交互作用項由兩個自變項centering後的交乘積形成) : b值 標準誤 bata值 t值 顯著性 允差 VIF : 截距 2.503 .914 2.739 .007 : X1r .105 .050 .129 2.091 .038 .828 1.207 : X2r .398 .066 .392 6.035 .000 .744 1.344 : X1c*X2c .117 .050 .136 2.333 .020 .930 1.075 : 此模式為我個人引註自Aiken和West(1991),亦是我在這篇發表paper : 中的模式,由數據結果來看,與模式一相較,共線性情況明顯改善, : 估計的參數對研究內容亦有不錯的結果發現。 : Model3:Y=b0+b1X1c+b2X2c+b3(X1c*X2c)+a : (自變項centering,交互作用項由兩個自變項centering後的交乘積形成) : b值 標準誤 bata值 t值 顯著性 允差 VIF : 截距 4.390 .925 4.746 .000 : X1c .105 .050 .129 2.091 .038 .828 1.207 : X2c .398 .066 .392 6.035 .000 .744 1.344 : X1c*X2c .117 .050 .136 2.333 .020 .930 1.075 : 此模式經P大先前提示,確實也為Aiken和West(1991)所證實之模式, : ,由數據結果來看,與模式一相較,共線性情況明顯改善;與模式二 : 相較,除了截距參數不同外,其餘參數皆一致。 : Model4:Y=b0+b1X1r+b2X2r+b3(X1r*X2r)c+a : (自變項不centering,交互作用項由兩個自變項未centering的交乘積形成, : 再直接對交互作用項進行centering) : b值 標準誤 bata值 t值 顯著性 允差 VIF : 截距 5.974 1.780 3.356 .001 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : (X1r*X2r)c .117 .050 .804 2.333 .020 .027 37.699 : 此模式為b大在原po e大的文章中回文所提到的 : "把x1*x2當成另一個變數z, 對新變數做中心化" : 雖然不知道引註自何處的觀點,但從分析結果可以瞭解 : 此模式與模式一相同,共線性問題嚴重,且與模式二和 : 模式三相較,截距與其他各估計參數皆不一致。 : Model5:Y=b0+b1X1c+b2X2c+b3(X1r*X2r)c+a : (自變項centering,交互作用項由兩個自變項未centering的交乘積形成, : 再直接對交互作用項進行centering) : b值 標準誤 bata值 t值 顯著性 允差 VIF : 截距 4.413 .926 4.765 .000 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : (X1r*X2r)c .117 .050 .804 2.333 .020 .027 37.699 : ※ 原模式五的資料key-in錯誤,已修正。 : 此模式亦為b大在先前的回文中,認為我所分析的模式四結果有異,是由於 : 我誤解他的原意所造成,b大認為"X1,X2,X1*X2各自做centering,不是只有X1X2做" : 因此,模式五來自於此。 : 結果顯示,與模式一或模式四一樣,此模式仍然有共線性的偏誤,進一步查驗 : 各估計參數,亦會發現,除截距外,各估計參數與模式四完全相同,但與模式 : 二和模式三相比更是差異頗大,彷彿完全不同的模式。 : 總結上述 如同我在前一篇回文最後所言道 : 中心化是一個操作簡單 意義複雜的議題 : 更不是研究者憑藉個人喜惡 欲對任何變項進行中心化就為之 : 以上述五個模式而言 模式二和模式三的作法 : 在SCI&SSCI期刊裡 探討交互作用議題中 廣為被接受與引用 : 也因此奠立了Aiken和West兩位學者的學術地位 : 然而 以量化研究的精神而言 : 我也不敢太早言斷 b大所提及的模式四與模式五是錯的 : 頂多只能自認為其觀點目前不夠嚴謹(共線性仍然嚴重) : 畢竟量化研究的哲學 從來無法證明"什麼是對的" 充其量只能證明"不是錯的" : 或許 b大可以引註其觀點來源 與眾板友們分享 : 最後 其實小弟的統計功力也不敢自稱有多好 只是個對統計議題有興趣的迷世書僮 : 希望能夠在這個園地 與來自各地的統計同好 一同討論 一同交流 教學相長 : 感謝各位費神地看完這長篇大文 如有任何疏漏 還望各位大大 不吝斧正 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.127.219.174 ※ 編輯: weare19 來自: 140.127.219.174 (08/11 15:06)