Re: [問題] 交互作用 負負相乘的問題

作者weare19 (一輩子的事)

看板Statistics

標題Re: [問題] 交互作用負負相乘的問題

時間Thu Aug 11 15:06:20 2011

請問如果是類別變數的話也可以利用C大提到的模型嗎? 將變數做centering 謝謝~ ※ 引述《coldwind0912 (隨風而逝~)》之銘言： : → bmka:y大, 那你最好檢查一下你的程式 10/09 19:44 : → bmka:sorry, 是 c大 10/09 19:45 : → bmka:BTW, 我的建議是 X1,X2,X1*X2各自做centering,不是只有X1X2做 10/09 19:47 : → bmka:其實想法很簡單, 就是利用centering去處理collinearity(笑) 10/09 19:55 : → bmka:(假裝不知道它們之間的關係),不過,這只能避免一點計算上的 10/09 20:24 : → bmka:小小問題...好處是除了截距項外其他係數不會變 10/09 20:31 : 我想既然b大有那麼多種的想法又要追求嚴謹 : 只好以我之前一份已經發表的paper裡的data 來檢驗各種在這個討論串曾提及的模型 : 以進一步驗證哪些意見是正確的哪些意見是不嚴謹的 : Model1：Y=b0+b1X1r+b2X2r+b3(X1r*X2r)+a (完全不調整資料的原始模形) : b值標準誤 bata值 t值顯著性允差 VIF : 截距 4.227 1.200 3.522 .001 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : X1r*X2r .117 .050 .804 2.333 .020 .027 37.699 : 基本上，在不調整任何資料型態的時候，在迴歸模式中，置入交互作用項 : 一定會導致共線性過高的問題，所估計之參數結果應該也是有偏誤的。 : Model2：Y=b0+b1X1r+b2X2r+b3(X1c*X2c)+a : (自變項不centering，交互作用項由兩個自變項centering後的交乘積形成) : b值標準誤 bata值 t值顯著性允差 VIF : 截距 2.503 .914 2.739 .007 : X1r .105 .050 .129 2.091 .038 .828 1.207 : X2r .398 .066 .392 6.035 .000 .744 1.344 : X1c*X2c .117 .050 .136 2.333 .020 .930 1.075 : 此模式為我個人引註自Aiken和West(1991)，亦是我在這篇發表paper : 中的模式，由數據結果來看，與模式一相較，共線性情況明顯改善， : 估計的參數對研究內容亦有不錯的結果發現。 : Model3：Y=b0+b1X1c+b2X2c+b3(X1c*X2c)+a : (自變項centering，交互作用項由兩個自變項centering後的交乘積形成) : b值標準誤 bata值 t值顯著性允差 VIF : 截距 4.390 .925 4.746 .000 : X1c .105 .050 .129 2.091 .038 .828 1.207 : X2c .398 .066 .392 6.035 .000 .744 1.344 : X1c*X2c .117 .050 .136 2.333 .020 .930 1.075 : 此模式經P大先前提示，確實也為Aiken和West(1991)所證實之模式， : ，由數據結果來看，與模式一相較，共線性情況明顯改善；與模式二 : 相較，除了截距參數不同外，其餘參數皆一致。 : Model4：Y=b0+b1X1r+b2X2r+b3(X1r*X2r)c+a : (自變項不centering，交互作用項由兩個自變項未centering的交乘積形成， : 再直接對交互作用項進行centering) : b值標準誤 bata值 t值顯著性允差 VIF : 截距 5.974 1.780 3.356 .001 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : (X1r*X2r)c .117 .050 .804 2.333 .020 .027 37.699 : 此模式為b大在原po e大的文章中回文所提到的 : "把x1*x2當成另一個變數z, 對新變數做中心化" : 雖然不知道引註自何處的觀點，但從分析結果可以瞭解 : 此模式與模式一相同，共線性問題嚴重，且與模式二和 : 模式三相較，截距與其他各估計參數皆不一致。 : Model5：Y=b0+b1X1c+b2X2c+b3(X1r*X2r)c+a : (自變項centering，交互作用項由兩個自變項未centering的交乘積形成， : 再直接對交互作用項進行centering) : b值標準誤 bata值 t值顯著性允差 VIF : 截距 4.413 .926 4.765 .000 : X1r -.328 .185 -.402 -1.771 .078 .061 16.377 : X2r -.069 .203 -.068 -.341 .734 .078 12.764 : (X1r*X2r)c .117 .050 .804 2.333 .020 .027 37.699 : ※ 原模式五的資料key-in錯誤，已修正。 : 此模式亦為b大在先前的回文中，認為我所分析的模式四結果有異，是由於 : 我誤解他的原意所造成，b大認為"X1,X2,X1*X2各自做centering,不是只有X1X2做" : 因此，模式五來自於此。 : 結果顯示，與模式一或模式四一樣，此模式仍然有共線性的偏誤，進一步查驗 : 各估計參數，亦會發現，除截距外，各估計參數與模式四完全相同，但與模式 : 二和模式三相比更是差異頗大，彷彿完全不同的模式。 : 總結上述如同我在前一篇回文最後所言道 : 中心化是一個操作簡單意義複雜的議題 : 更不是研究者憑藉個人喜惡欲對任何變項進行中心化就為之 : 以上述五個模式而言模式二和模式三的作法 : 在SCI&SSCI期刊裡探討交互作用議題中廣為被接受與引用 : 也因此奠立了Aiken和West兩位學者的學術地位 : 然而以量化研究的精神而言 : 我也不敢太早言斷 b大所提及的模式四與模式五是錯的 : 頂多只能自認為其觀點目前不夠嚴謹(共線性仍然嚴重) : 畢竟量化研究的哲學從來無法證明"什麼是對的" 充其量只能證明"不是錯的" : 或許 b大可以引註其觀點來源與眾板友們分享 : 最後其實小弟的統計功力也不敢自稱有多好只是個對統計議題有興趣的迷世書僮 : 希望能夠在這個園地與來自各地的統計同好一同討論一同交流教學相長 : 感謝各位費神地看完這長篇大文如有任何疏漏還望各位大大不吝斧正 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.127.219.174 ※ 編輯: weare19 來自: 140.127.219.174 (08/11 15:06)