看板 Statistics 關於我們 聯絡資訊
各位前輩好: 我的研究主題是 "不同時期對於各個醫師每月每診平均看診人次的影響" 老師說,要設虛擬變數進行迴歸分析 但我先從資料中, 選一位醫師進行不同時期(有四個時期,我設三個DUMMY),對該位醫師迴歸分析 老師回信給我說我做錯了 應該全部醫師都設DUMMY,不可以一個個分開跑迴歸 請問該怎麼處理比較好? 謝謝解答~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.74.49 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1528701997.A.AFC.html
maoc: 每個醫生也設個虛擬變數?你有多少個醫生? 06/11 18:10
sweetmimi: 有123個醫師 06/11 18:39
maoc: 總共多少筆資料? 06/11 19:26
myty383: 我看完覺得有2種可能 06/11 19:26
myty383: 1.不同醫生和不同時期同時設定dummy 06/11 19:26
myty383: 2.只設定不同時期的dummy 06/11 19:29
myty383: 另外有一種我常使用的方式是Cluster 醫生的變數 06/11 19:30
myty383: 也可以讓不同的醫生之間的差異不要影響研究結果 06/11 19:31
sweetmimi: 大概快3000筆資料 06/11 21:40
sweetmimi: my大,老師是想要我做您說的1.不同時期和不同醫師都要 06/11 21:41
sweetmimi: 設dummy,但有點卡住,不知道該怎麼跑 06/11 21:41
myty383: 如果123個醫生有編號會好處理一點,不然就要自己設定 06/11 22:14
myty383: 就是每一筆資料會有122個醫生的虛擬變數+3個時期變數 06/11 22:15
myty383: 122個都是0代表第一個醫生 一個1 121個0代表第二個之類的 06/11 22:16
myty383: 如果有編號可以想辦法編成1~123就可以迴圈產生 06/11 22:17
myty383: 沒有的話可能就要先給編號然後看你的資料特性改了 06/11 22:18
myty383: 可能就要給看到資料的人才有辦法解決了 06/11 22:18
sweetmimi: 謝謝my大,有幫醫師編號,我再研究看看:( 06/11 23:23
obarisk: 直接設成名義變數 06/12 00:08
chien533: 你這應該把醫生設定成隨機變項,讓每個醫生跟所有醫生 06/18 10:57
chien533: 的平均來比才有意義。設定dummy variable得預設某個醫 06/18 10:57
chien533: 生當作reference level, 但你準備要讓哪個醫生當referen 06/18 10:57
chien533: ce level? 亦或是哪個醫生夠格當reference level?這是你 06/18 10:57
chien533: 得在文章內回答的問題。 06/18 10:57
tang1019: 醫生有123個,必需依屬性分成幾類,例如性別、年齡、科 07/17 15:13
tang1019: 別、或其他有研究意義的類別,再用這些變項做迴歸 07/17 15:16