作者chiehfu (努力)
看板Statistics
標題[問題] propensity score matching 問題
時間Thu Jan 28 16:02:31 2016
在做propensity score matching時遇到了幾個問題:
1. 如果logistic regression只放age及gender這兩個變項, 跑出來還可以
但只要再加一個變項 (可能要放的原本有10個變項), 年齡性別差距就非常大
請問是何種原因?
2. 跑logistic regression時計算出來的分數分布非常廣, 0.001~0.6xx都有,
我用網路上查得的 Parsons LS的方法 8→1 digit match似乎是不太能用的,
請問何種方式比較適合?
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.125.97.119
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1453968155.A.444.html
推 Rhomboid: 1. 我想先確定你logistic regression中dependent放什麼 01/28 20:19
→ Rhomboid: 你的dependent若和你新的變項很有關但是和性別較無關 01/28 20:20
→ Rhomboid: 自然跑出來的結果性別年齡兩組會差很多 01/28 20:21
→ Rhomboid: 你就用stratified matching解決 01/28 20:21
→ Rhomboid: 2. Nearest neighbor match即可 不用管有幾個digit? 01/28 20:21