Re: [問題] 交互作用 負負相乘的問題

作者Prozac (沒事不要亂吃)

站內Statistics

標題Re: [問題] 交互作用負負相乘的問題

時間Thu Oct 7 21:42:17 2010

可討論的點很多不過既然原po提到用中心化處理共線性那我就以這點分享一點看法我不認為中心化主要目的是處理共線性的問題一般而言共線性來自於迴歸係數的估計式會受到獨變數之間的相關影響公式請詳見迴歸書或是一般統計書對於加入的連乘積項X1X2可能會造成共線性的問題改為中心化的C1C2可能可以處理這問題但也不是屢試不爽的好方法剛剛隨便弄了個例子就發現中心化反而相關上升我會從交互作用的意義來看中心化的好處中心化(centering) 最簡單的想法就像計算共變數公式要去中心一樣減掉平均數是為了控制兩變數在同一個起始點上看兩變數之間的大小關係是否有所相關有的話共變程度大沒有的話共變程度小 > 也可以套至相關那為何處理調節變項要去中心化？我先來談調節變項的意義簡單而言，調節變項是捕捉交互作用的效果交互作用的效果可以稱為某獨變項影響依變項的效果受到另一個讀變項的影響的效果很饒口對吧？那簡單一點來講交互作用就是非線性的效果的一種從定義把數學式子寫一寫就很簡單了假設X1的對Y的預測能力（或是說效果影響等等都可以）受到X2的大小影響也就是X2的大小會影響到X1影響Y的效果或是預測能力以上可以寫成 Y = a0 + (a1 + a2X2)X1 + a3X2 = a0 + a1X1 + a3X2 + a1a2X1X2 = B0 + B1X1 + B2X2 +B3X1X2 在數學上X1X2就是一個非線性的效果我們可以說因為存在交互作用因此單就線性模型Y = B0 + B1X1 + B2X2 不足夠需要在加上X1X2的乘積項捕捉交互作用的效果那如果不作中心化會怎樣？此時B3會很難解釋！！ X1X2上升一單位在沒有中心化處理下意義完全不明！因為X1 X2 可能一個是身高一個是5點量表他們的乘積上升一單位？嗯？沒人知道那是啥鬼但是中心化後 X1X2上升一單為的意義就是兩者往共同方向移動了一單位這就會讓研究者方便許多那既然如此我就來在推導一下其實中心化就只是針對X1X2的乘積項至於X1 和 X2 其實是可以不需要中心化的上一篇提到的那本回歸參考書（A先生＆W先生）也有提到這點令C1為中心化過的X1 M1為X1的平均數 Y = b0 + b1X1 + b2X2 + b3C1C2 = b0 + b1C1 + b2C2 + b3C1C2 + b1M1 + b2M2 = b0'+ b1C1 + b2C2 + b3C1C2 也就是說不管X1放的是原始資料還是中心化過的C1 這都只影響到截距項的估計對其他係數不會任何影響～詳細推導請參考書籍以上只是一點淺見 -- 額外話每次看到有人用工讀生時薪在徵統計分析幫手都覺得囧或許某些老師覺得統計就是點一點寫寫語法而已沒啥了不起就把資料丟進去把結果給他然後他就可以寫paper 科科 ※ 引述《coldwind0912 (隨風而逝~)》之銘言： : 我是用一個比較簡單的方法來舉例 : 我在舉一個例子 : x1 x2 x1x2 : case1 6 9 54 : case2 2 3 6 : 假設x1 mean=4 x2 mean=6 : 所以中心化之後： : x1' x2' x1'x2' : case1 2 3 6 : case2 -2 -3 6 : 請問c大這樣一樣是合理的嗎？謝謝？ : 我還是不太懂你的意思:) : 從你這個例子來說 : 當我們假定 X1 X2 都是一個 0~10 的分數正代表滿意負代表不滿意 : ※(其實負分根本不存在因為尺度是0~10 不會有負) : 在csae1的情況當X1在中心化前是6 中心化後是2 : 對於X1的意義而言不論是6還是2 都是代表滿意 : 可是如果太執著數字大小會誤認為在中心化後滿意度降低了(這是錯的觀念) : 實際上中心化前的6分和中心化後的2分是一樣的 : 因為尺度已經從 0~10 變成 -4 ~ 6 (Mean=4，同減) : 但是首先會有問題的是X1在case2的時候 : 在case2的情況 X1在中心化前是2 中心化後是-2 : 但是對於X1的意義而言不論是2還是-2 一樣都還是代表滿意(請見前述※處) : 實際上中心化前的2分和中心化後的-2分是一樣的 : 因為尺度已經從 0~10 變成 -4 ~ 6 (Mean=4，同減) : 最後就是交互作用項的問題 : 基本上這也是這個問題當中最複雜的一點 : 因為交互作用的說明不是直接以數字的正負或大小就能理解的 : 以CASE1 來說你一定會問中心化前的54 中心化後的6 為什麼會變化那麼多? : 以CASE2 來說你就是問中心化前的6 和中心化後負負得正的6 是一樣的嗎? : 其實這裡我也很難以一個中文說法來表達 : 不過基本上對於中心化的議題大部份都是參考Aiken&West(1991)的paper : 或許這麼說好了(也許會有點言不及意這是我個人的解讀) : 不論是case1的54和6 或case2的6和6 : 基本上它都是「反應X1和X2同時在Y上高低程度的共同比例效果」 : 只是在中心化前會受平均數的影響 : 但是就這個例子而言 : case1的x1和x2為6,9 case2為2,3 其實這比例效果是一樣的(中心化後都為6) : 所以回到問題中心化的操作或許很簡單但是中心化的意義很複雜 : 有時不要用正負、大小就直接思考判斷 : 在交互作用的議題裡這種直觀式的判斷往往都是錯的 : 也希望有板上其他高手來進一步說明或一討論這個中心化的問題吧我的能力也有限 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.224.49.80

推 coldwind0912:推導詳細先給推尤其是"交互作用是非線性關係" 10/07 21:52

→ coldwind0912:只是對於前述中心化與共線性無關之觀點尚加保留 10/07 21:53

→ coldwind0912:我個人不敢這麼斬釘截鐵只是我的確有聽聞這個說法 10/07 21:53

→ coldwind0912:但就當前在學術paper的呈現而言 10/07 21:54

→ coldwind0912:中心化確實是回應共線性爭議的權宜之計 10/07 21:55

→ Prozac:嗯如果是就相乘項和其他變數共線性的問題去中心化的確是 10/07 21:59

→ Prozac:我想我前面是指其他變數的共線性問題不過這樣寫實在不好 10/07 22:00

→ Prozac:感謝你的提醒！ 10/07 22:01

推 wlsherica:推~ 也推最後一段 10/07 22:30

→ Prozac:樓上似乎也是常在pt板用統計當關鍵字搜尋的哈哈 10/07 22:42

推 wlsherica:XD 觀賞一下現在的價位嘛 10/07 22:46

→ bmka:你中間的說法似乎把centering跟standardization搞混了 10/08 07:16

→ chenyutn:是說會sem時薪一百的那篇文嗎 XD 10/08 08:34

→ coldwind0912:原來大家都在討論後站大學那篇會SEM時薪100的文 XD 10/08 10:35

→ coldwind0912:回b大對截距而言中心化也是標準化的其中一種方法吧 10/08 10:38

→ bmka:?? 10/08 10:47

→ bmka:你這句話邏輯怪怪的 10/08 10:48

→ bmka:Are you sure what you are talking about? 10/08 10:50

推 evilove:我也有搞混，為什麼減去平均數能稱為標準化？ 10/08 10:57

→ coldwind0912:對截距而言... 10/08 11:31

→ Prozac:中間哪邊的說法？ B大可以講詳細點嗎？ 10/08 11:43

→ Prozac:標準化包涵中心化的效果不過後者並沒有調整尺度 10/08 12:07

→ Prozac:不知道B大是不是指起跑點那句話 10/08 12:09

→ coldwind0912:標準化&中心化都是讓截距歸零但標準化還去除了單位 10/08 12:15

→ bmka:"X1X2上升一單位在沒有中心化處理下意義完全不明！" 10/08 19:45

→ bmka:這段話開始,你指的應是標準化,而不是單純的中心化 10/08 19:45

→ bmka:"標準化&中心化都是讓截距歸零"..沒這種說法吧... 10/08 19:49

→ bmka:c大, 所以中心化不是標準化 10/08 19:51

→ Prozac:X1X2上升一單位和有沒有標準化不影響吧 1單位就是0變1 10/08 20:01

→ Prozac:不過兩者尺度差很多時乘積也實在不好解釋 10/08 20:09

→ bmka:如果你不是在談標準化,何必舉單位不同的例子? 10/08 20:26

→ bmka:還有"兩者往共同方向移動了一單位"這句話需要再解釋 10/08 20:29

→ bmka:否則會有誤解 10/08 20:30

→ Prozac:嗯我想不是DUMMY VARIBLE 相乘項係數都不是很好解釋 10/09 00:07

→ Prozac:感謝B大的指教剛作了些小模擬要解釋相乘項實在不容易 10/09 00:09

→ coldwind0912:我覺得 P大的那段說明並不會令人搞混呀.... 10/09 00:09

→ coldwind0912:對於單位不同的變項使用標準化做資料調整固然沒錯 10/09 00:10

→ coldwind0912:但是依照P大例子其實中心化就足以進行解釋 10/09 00:12

→ coldwind0912:我個人是覺得不必使用到標準化 10/09 00:12

→ coldwind0912:只是標準化涉及去除單位有時失去單位未必利於解釋 10/09 00:14

→ coldwind0912:至於有關兩種方法都涉及"讓截距歸零"的說法... 10/09 00:15

→ coldwind0912:基本上會在此討論中的人都明白中心化不等於標準化 10/09 00:16

→ coldwind0912:但是標準化的過程一定經過中心化這應該不需要爭了 10/09 00:17

→ coldwind0912:但如同前述標準化去除了單位未必有利於資料的解釋 10/09 00:19

→ coldwind0912:而且對於某些測量尺度而言截距本身就難以解釋 10/09 00:20

→ coldwind0912:如果在中心化或標準化的選擇上更應該謹慎選擇.... 10/09 00:21

既然大家都聊這麼高興我就來讓所謂中心化會讓研究者更好解釋這件事具象化一點假設樣本數20 X1為滿意度五點量表（平均數3.15） X2為身高（平均數164.68）甲的身高是136.8 滿意度是1 乙的身高是136.4 滿意度是5 X1X2（甲）為 136.8 X1X2（乙）為 682.1 中心化 C1C2（甲）為 -52.29 C1C2（乙）為 59.95 兩者都可以補抓一個事實當身高越高（低）滿意度約高（低）相乘積越大而反之身高越高（低）滿意度越低（高）則會越小但是中心化可以讓這件事情變得更極端從資料來看甲乙的X1X2只有高低之分（皆為正數）但C1C2卻是一正一負事實上X1X2的資料無法給予太多資訊因此再解釋上我們可以很確定C1C2代表的是一種"共變"的指標 X1X2則沒有辦法其實也不用講這麼複雜想想共變數的定義就知道了（汗）附上資料讓各位參考看看 X1 X2 C1 C2 X1X2 C1C2 [1,] 4 181.29 0.85 16.606 725.16 14.1151 [2,] 4 182.36 0.85 17.676 729.44 15.0246 [3,] 5 176.17 1.85 11.486 880.85 21.2491 [4,] 4 145.14 0.85 -19.544 580.56 -16.6124 [5,] 1 163.05 -2.15 -1.634 163.05 3.5131 [6,] 3 176.93 -0.15 12.246 530.79 -1.8369 [7,] 3 157.06 -0.15 -7.624 471.18 1.1436 [8,] 4 131.96 0.85 -32.724 527.84 -27.8154 [9,] 5 196.84 1.85 32.156 984.20 59.4886 [10,] 1 196.80 -2.15 32.116 196.80 -69.0494 [11,] 1 163.98 -2.15 -0.704 163.98 1.5136 [12,] 4 181.44 0.85 16.756 725.76 14.2426 [13,] 3 168.90 -0.15 4.216 506.70 -0.6324 [14,] 4 181.92 0.85 17.236 727.68 14.6506 [15,] 5 136.42 1.85 -28.264 682.10 -52.2884 [16,] 4 144.32 0.85 -20.364 577.28 -17.3094 [17,] 3 138.78 -0.15 -25.904 416.34 3.8856 [18,] 2 144.94 -1.15 -19.744 289.88 22.7056 [19,] 2 188.58 -1.15 23.896 377.16 -27.4804 [20,] 1 136.80 -2.15 -27.884 136.80 59.9506 看看資料應該就很明白我想表達的意含了我想這就是我認為中心化會比較好解釋的理由至於標準化那件事 X1X2有無標準化都只會影響係數估計值對R SQUARE和係數檢定都不會有影響我覺得這就取決於研究者的習慣即可以上是拙劣的鋪陳感謝耐心看完的板友 ※ 編輯: Prozac 來自: 61.224.49.80 (10/09 01:00)

推 coldwind0912:P大辛苦了.... 10/09 01:08

→ Prozac:我一定是不想寫作業才這麼認真回文唉唉 10/09 01:09

→ coldwind0912:其實從sample 9.10.15.20 的比較就可以明白原理 XD 10/09 01:10

→ Prozac:反正也只是複製貼上而已哈哈冷風大我要出門去有空再聊啦 10/09 01:12

→ bmka:看不太懂你想表達什麼...59.95 vs -52.29比682.1 vs. 136.8 10/09 03:05

→ bmka:極端? 極端在哪裡?只是因為有負號嘛..極端好像不該是這樣定義 10/09 03:06

→ bmka:為什麼C1C2代表的是一種"共變"的指標,X1X2則沒有辦法? 10/09 03:07

→ bmka:沒有辦法是什麼意思? 10/09 03:08

→ Prozac:跟正負號無關這跟共變數要減平均數的道理一樣 10/09 03:11

→ bmka:你應該拿Y = b0 + b1X1 + b2X2 + b3C1C2跟 10/09 03:11

→ bmka:Y = a0 + a1X1 + a2X2 +a3X1X2來比較然後進行你的論述 10/09 03:12

→ bmka:拿它來跟Y = d0 + d1C1 + d2C2 + d3C1C2比沒什麼意思 10/09 03:14

→ bmka:還有,你的regression model都寫錯了(包括我上面剪貼/編輯過 10/09 03:15

→ Prozac:如果B大看一下所附模擬資料或許能抓到我的意思 10/09 03:15

→ bmka:的都是不正確的) 10/09 03:15

→ bmka:P大, 不是要故意找麻煩啦.不過如果這是篇報告的話, 10/09 03:18

→ bmka:會被我改得滿江紅 10/09 03:18

→ Prozac:資料點20 X1和X2同時很小 C1C2能反應出這共變程 X1X2則否 10/09 03:19

→ bmka:寫文章不能用一堆"形容詞"卻給不出定義來 10/09 03:20

→ Prozac:這不是報告只是閒聊但也很高興你的指教 10/09 03:21

→ bmka:X1, X2同時很小但是X1*X2看不出很小??? = = 10/09 03:21

→ Prozac:如果你指的寫錯是指Y應該是Y hat 那我承認這是很粗略的寫法 10/09 03:22

→ bmka:這不是"簡單疏失"而已(笑) 10/09 03:24

→ Prozac:X1X2同時小 X1X2當然小 = = 但是C1C2則的值卻會很大 10/09 03:24

→ Prozac:所以我說C1C2反應共變的效果 X1X2則否(除非平均數本來就零) 10/09 03:26

→ bmka:請定義什麼叫反應共變的效果 10/09 03:27

推 coldwind0912:以樣本9和樣本20作參照 10/09 08:57

→ coldwind0912:當X1,X2皆大時 X1X2極大(984.20) 但C1C2為59.49 10/09 08:57

→ coldwind0912:X1,X2皆小時 X1X2極小(136.80) 但C1C2仍為59.95 10/09 08:58

→ coldwind0912:由此可見當X1,X2反應趨勢一致(皆大or皆小)時 10/09 08:58

→ coldwind0912:C1C2的effect是差不多的但X1X2是不一樣的 10/09 08:59

→ coldwind0912:但加入樣本10和樣本15作參照時更可以發現 10/09 08:59

→ coldwind0912:當X1,X2呈現一大一小時 X1X2並不穩定 10/09 09:00

→ coldwind0912:分別為196.80、682.10 10/09 09:00

→ coldwind0912:但兩者在C1C2時卻也相對接近-69.05、-52.29 10/09 09:00

→ coldwind0912:或許這就是P大所謂"反應共變的效果" 10/09 09:01

→ coldwind0912:如同我前述的用詞 "反應趨勢一致" 10/09 09:01

→ coldwind0912:但這個現象的詞在中文裡或許尚未有一致的用詞 10/09 09:01

→ coldwind0912:若b大對於這個現象有精準的用詞與定義願聞其詳 10/09 09:01

→ coldwind0912:題外話一點這應該是大家的閒聊、討論或交流 10/09 09:03

→ coldwind0912:不知道為何b大要以作業批改的心態視之 10/09 09:04

→ coldwind0912:畢竟我覺得不論是我或P大 post這些想法或為板友釋疑 10/09 09:07

→ coldwind0912:應該都不是在交作業給b大或眾板友批閱的吧!? 10/09 09:07

→ bmka:不嚴謹的說法不能討論批評嗎? 閒聊出門左轉有chat版 10/09 09:23

→ coldwind0912:或許指正、批評、挑語病三者需要有個明確的定義 XD 10/09 11:08

我覺得b大提的點跟對符號跟用字的精確，都是我在描述事情的缺點，所以我非常高興b大能有所指教！不過我昨天凌晨實在有點不行了共變的程度這不是很精確的用詞我的原意只是希望板友能概念上的抓到我想講的東西所以用了一些形容詞和詞彙等等我試著看看能不能盡量簡截的把共變的程度作一個定義：「定義為兩變數減去個別期望值的乘積，正值表示兩變數大於或小於個別期望值，負值表示有一變數大於其期望值及一變數小於其期望值，此乘積的期望值等同於兩變數的共變異數(Covariance)。」意義上，樓上C大的舉例其實就很清楚明瞭了。操作上，將此乘積放入迴歸模型當作獨變項，其迴歸係數的檢定結果，能幫助研究者瞭解，在給定資料下，研究者認為存在交互作用，是否有統計上的支持。不過我自己的心得是，很多人對符號並不敏感需要多用舉例或是一些詞彙來說明會比較易懂當然如果我又開始自嗨而用字亂七八糟不嚴謹時希望往後b大也能不吝提醒！ ※ 編輯: Prozac 來自: 114.43.117.75 (10/09 13:24)

推 evilove:b大在我的推文建議"把 x1*x2當成另一個變數z, 對新變數做 10/09 14:22

→ evilove:中心化"如果用這個方法模擬P大的資料，結果似乎不一樣。 10/09 14:24

→ evilove:(case9, case20) 會變成 (464.5225, -382.878) ？ 10/09 14:26

推 coldwind0912:以我的經驗來說 P大的做法PAPER引用很普遍 10/09 14:30

→ coldwind0912:b大的作法我倒是第一次聽到不知道引述自何處 10/09 14:31

→ coldwind0912:而且我以過去自己一篇已發表的paper數據進行實作 10/09 14:42

→ coldwind0912:原本的模式我就是使用 X1、X2、C1C2 → Y 10/09 14:43

→ coldwind0912:但改以 X1,X2,Z(centering後) → Y 結果估計值都不同 10/09 14:45

→ bmka:y大, 那你最好檢查一下你的程式 10/09 19:44

→ bmka:sorry, 是 c大 10/09 19:45

→ bmka:BTW, 我的建議是 X1,X2,X1*X2各自做centering,不是只有X1X2做 10/09 19:47

→ bmka:其實想法很簡單, 就是利用centering去處理collinearity(笑) 10/09 19:55

→ bmka:(假裝不知道它們之間的關係),不過,這只能避免一點計算上的 10/09 20:24

→ bmka:小小問題...好處是除了截距項外其他係數不會變 10/09 20:31

→ bmka:所以,我並沒有回答e大問的"如何處理負值"的問題 XD 10/09 20:33

→ bmka:對C1C2比X1X2在變數本身的解釋上有意義的看法,我不反對 10/09 20:53

→ bmka:但是用C1C2的目的最主要還是想解決collinearity的問題 10/09 20:58

→ bmka:Interaction term不能單獨解釋,要連main effects一起解釋 10/09 21:02

→ bmka:才會完整 10/09 21:03

→ bmka:所以e大舉的例子裡2*3=6,-2*-3=6,單看interaction的值似乎 10/09 21:26

→ bmka:不合理,但是如果再考慮(2, 3), (-2,-3)的不同就不會太奇怪了 10/09 21:27

→ bmka:可以用X1={-1,1}, X2={-1,1},畫個2X2 table來看就清楚了 10/09 21:28

推 bluechuchy:基本上，去中心化的用意在還原真實現象中的反應一致性 10/12 18:19

→ bluechuchy:趨勢，只是將數字上所膨脹的「虛假」還原真實「程度」 10/12 18:21

→ bluechuchy:b大還是去把Aiken&West(1991)抓出來看比較實際 10/12 18:23

→ bluechuchy:這就是為什麼2*3=6,-2*-3=6 在程度意義上為「相同」 10/12 18:35

→ bluechuchy:這不就是運用GLM方法上大家所最樂見的事嗎? 10/12 18:36

→ bluechuchy:(2, 3)→兩個都高，(-2,-3)→兩個都低 10/12 18:38

→ bluechuchy:所以，兩個相乘後皆為6，其實他們的趨勢意義上是相同的 10/12 18:40

→ bluechuchy:不知道這樣的解釋是否夠白話? 10/12 18:42

→ bmka:不如去看看 Echambadi and Hess (2007).Mean-Centering Does 10/13 07:39

→ bmka:Alleviate Collinearity Problems in Moderated Multiple 10/13 07:40

→ bmka:Regression Models. 10/13 07:40

→ bmka:中心化後的design matrix其實還是原來design matrix的 10/13 07:42

→ bmka:linear transformation. 所以covariate vector space所展開 10/13 07:42

→ bmka:的空間是一樣的,也就是說fitted model根本都是一樣的 10/13 07:43

→ bmka:做中心化只是讓新的design matrix 的cross-prodct在求矩陣 10/13 07:44

→ bmka:的反距陣的數值計算比較穩定(當cross-product matrix接近 10/13 07:45

→ bmka:singular的情況),也就是說只有在共線性非常強的時候才有可能 10/13 07:47

→ bmka:看到其效果,所以中心化其實純粹是解決數值運算問題 10/13 07:48

→ bmka:而不是fit了一個新的model... 10/13 07:49

→ bmka:請不要直接比較中心化(不管哪一種方式)跟沒有中心化的 10/13 07:55

→ bmka:regression table,然後說這兩個方法得到不一樣的結果 10/13 07:56

→ bmka:要記得,展開整理過再比,那麼你會發現不論是係數或是SE的估計 10/13 07:57

→ bmka:都是一模一樣(除了在很極端的case碰到求反矩陣的數值問題) 10/13 08:01

→ bmka:至於(X1-m1)*(X2-m2)比X1*X2解釋上是否比較有意義 10/13 08:10

→ bmka:我沒意見(也從沒反對過) 10/13 08:11

→ bmka:上面指的是單獨一項變數來看...但最終要解釋interaction 10/13 08:20

→ bmka:還是必須要把X1, X2納進來一起解釋 10/13 08:21

→ ADORIAN:上面最後兩句話是討論串的重點啦~ 直接去解釋 X1*X2 或 10/13 14:11

→ ADORIAN:(X1-m1)*(X2-m2)的數值都是無意義的. 10/13 14:12

推 evilove:b大的title少了一個字Mean-Centering Does Not Alleviate 10/13 14:33

→ evilove:謝謝各位給予建議的朋友們，現在觀念清楚多了^___^ 10/13 14:34

→ bmka:oops, sorry....少一個NOT差很多.... XD 10/13 19:49

→ Prozac:水喔文獻終於來了我會找來看看謝啦B大 10/14 01:19

→ Prozac:哈哈 PAPER裡的報表有很可愛的解說箭頭 10/14 01:21