看板 Statistics 關於我們 聯絡資訊
想問問版友一個問題 當資料是由兩類人組成 要怎麼決定是建一個模型就好 還是建立兩個模型? 資料是這樣的: 預測binary決策(購買某保險) 用logistic 問題來了 其實樣本是由兩群人組成的 這兩群人有一群是單A國籍 另外一群人是AB雙重國籍 所以 AB雙重國籍者 也會擁有A單國籍者的variables 但是單A不會有B國籍的資料 例如 國家居住年限 國家繳稅與否 .... 目前 兩群人購買其他某保險的比率是 (80:20 73:27) 我現在有點傷腦筋是 到底應該怎麼判斷 是不是應該分開建模型 還是全弄在一個反正沒該項資料的就補0就好了.... 有任何學理上的標檢驗判斷準作法嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.210.58.35 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1409798237.A.CD0.html
onionsteven: 淺見:模式一個 只有A有的資料不放入 09/04 17:17
gogostay: 我的想法是...模型一:只納入A國籍,模型二:只納入雙重國 09/04 20:44
gogostay: 個模型較優.僅供參考^^ 09/04 20:47
gogostay: 模型二:只納入雙重國籍,模型三:建一個國籍變數,A國給0, 09/04 20:48
gogostay: 雙重給1,最後比較哪個模型較優,僅供參考 09/04 20:48
andrew43: 大方向是:你的母體為何? 09/04 22:16
母體是購買過某保險公司某類產品的人 這些人不然就是a單國籍 不然就是ab雙重國籍
GoldLight: multigroup model 09/05 02:34
GoldLight: 但是它有一些假設,請參照你的研究問題y 09/05 02:36
yhliu: 建議分別建模, 可以避免一些麻煩. 單一模型固然有其可取之 09/05 16:50
yhliu: 處, 但也有一些條件需要考慮, 需要檢查. 09/05 16:50
謝謝大家分享指教 ※ 編輯: cawaiilulu (24.210.58.35), 09/08/2014 03:09:08