作者wearytolove (奪真書生A.W.)
站內R983220PA
標題[討論] 社科統C14.4
時間Fri Nov 27 17:38:18 2009
C14.4,也就是討論商業特許區EZ對失業率宣告的關係,與E13.8的比較
我在回去想了很久以後,發現我們之前的講法不太對,所以po出來大家討論一下
E13.8中,一開始式子為log(eclms)=θt + Bezit + ai + uit
而C14.4的式子為log(eclms)=Ci*t + Bezit + ai + uit
這兩個有什麼差異呢?
θt的意思代表說,在80~88年中,全部地區失業率都會有某種上升,
因此θt代表的是不同年裡,全部地區失業率平均數的差異
而Ci*t代表是說,這個式子認為,每一個地區都會有某一種特性
這種特性會隨著時間越變越嚴重
ai代表的是,每個地區都有某一種特性
這種特性在不同年間的影響會是一樣的
假如畫張表的話,可以這樣解釋....
對資料的假定 │ 不隨時間變化 │ 會隨時間變化
────────┼───────┼───────
不隨地區變化 │ β0 │ θt=d81+d82+....
────────┼───────┼───────
會隨地區變化 │ ai │ Ci*t
────────┼───────┼───────
舉個例
θt可能是全國平均經濟成長率,也就是全國各地都上升這樣的量
ai可能是當地生活習慣,例如說A地的人喜歡工作4年出去玩1年
因此失業率永遠比其它地方低20%
ai=20%
Ci可能是當地人口淨增加量,例如A地每年都會增加5%的人,B地持平
第二年後A地就比B地多10%的人,三年就15%....
而或許這淨增加量中就會有固定比例β*Ci*t的人失業
這個表格也許可以解釋為什麼E13.8跟C14.4(ii)會有所不同
E13.8只把θt跟ai放進式子裡,代表說他只測量可能因地變或因時變的值
使用F.D.之後,隨地變的ai消失,剩下θt以d81 d82 ....來代表不同年的平均差異
此時資料探討的是ez變化量對失業率變化量的影響
已被解釋的是每一年的總體平均差異θt,再依△ez把資料分成忽然有ez,持平,忽然沒ez
然後來計算這三組資料的平均差異,就是β1
這樣無法被解釋到的,就是假如有存在Ci*t,他將會成為跑完迴歸的intercept
也就是本來的θt中將會包含Ci的平均值,而β1則可能會被Ci-Mean(Ci)影響
舉例來說,也許經濟明明很差,θt>0,但是因為各地平均淨人口量都在下降
因此失業人口也變少,只用θt來看反而是負的,因為變θt+Mean(Ci)
也就是d81,d82....的係數會比較不準,而β1被影響的較小,
除非Ci-Mean(Ci)與ez有correlated
C14.4(ii)則是把Ci*t與ai放進去,代表說他測量因地變的值,或因時地而固定增加的量
先使用F.D.之後,ai消失,而Ci*t剩下Ci
此時資料探討的是ez變化量對失業率變化量的影響
已被解釋的是每一地每年的固定變化量Ci,再依△ez把資料分成忽然有ez,持平,忽然沒ez
此時無法被解釋到的,就是平均變化量θt,θt的平均值會被加到Ci中
會這樣說,是因為假如各地都是增加Ci,那麼每年整體會增加ΣCi,因此必包含θt平均值
此時再做fixed effect,Ci就被消掉了
沒有被考慮到的,就是每年不同的增加量θt-Mean(θt)的值,可能會影響ez
舉例來說,可能有一年θt-Mean(θt)大於零,正好當年有ez較多,則β1就變大了
這也使得用這式子算出來的β1比較不精確
因此,C14.4(iii)又多加了時間變數,則是把每年不同的增加量θt-Mean(Ci)的值也考慮
這樣新的ez中,就不會包括Ci*t,也不會包括θt,也不會包括ai
算出來的就是純粹△ez與△log(eclms)之間的關係了
(假設沒有其它新變數應考慮,u~N)
以上一些意見,歡迎同學們更進一步討論!
雖然我覺得這樣寫應該沒什麼人看得懂,因為我自己也看不太懂...Orz
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.150.172
※ 編輯: wearytolove 來自: 140.112.5.19 (11/27 22:58)
※ 編輯: wearytolove 來自: 140.112.5.19 (11/27 23:17)
推 lingary:天書.....翻譯米糕使用中 11/28 05:10
推 LoveSeverus:看不太懂+1 XDDD 11/28 22:07
推 lingary:我又看懂了一點惹....謎題已經完全解開了(頭背後一條白線) 11/30 05:39