看板 Statistics 關於我們 聯絡資訊
最近我老闆的資料裡有一個依變項是由10題單純詢問有沒有使用不同服務 相加得出的指標,所以這個依變項最小值=0 最大值=10, 而這個依變項有很多0,比較接近poisson的分佈,可能平均數等於變異數 所以他要我用posisson來處理。 我的問題是,poisson不是處理"固定時間"內事件發生機率的情況嗎? 像上述的資料也能稱做count data嗎?是允許用poisson來處理的嗎? 又如果不允許的話,請問是不是進行線性轉換,使用線性迴歸即可呢? 第二個問題是 我手上有一筆資料的分佈是一個比例的資料介於 0~1 但是他的分佈是三個峰分別是0, 0.5, 1 http://ppt.cc/GZ29 不曉得這樣的分佈各位建議怎麼處理呢? 我只有想到quantile regression,不曉得對不對? 謝謝:) ※ 編輯: evilove 來自: 67.167.206.227 (10/10 10:44)
yhliu:不一定符合 Poisson, 但或許可算 Poisson like. 10/10 12:12
yhliu:可能不符合 Poisson 的原因是 (1)10題不算多;(2)各題間相關. 10/10 12:13
yhliu:若 X1,...,Xn 是相互獨立, 成功率極低的 Bernoulli 隨機變數 10/10 12:14
yhliu:n 夠大, 而成功率加總值不大,則 X1+...+Xn 近似服從 Poisson 10/10 12:15
bmka:第二個問題解釋一下response variable是怎麼得來的吧 10/13 12:44
bmka:"% of total grants success"那麼應該有total grants跟 10/13 12:45
bmka:numer of successful grants的原始資料吧(?) 10/13 12:46
evilove:b大,你說的沒錯,有那兩項資料。 10/13 13:58
bmka:try random effects model for binary data, 每個人是一個 10/14 05:28
bmka:cluster, "number of grant applications"是cluster size 10/14 05:29
bmka:outcome for each grant application is binary (success/ 10/14 05:30
bmka:failure) 10/14 05:30
evilove:謝謝b大,我來研究看看你說的方法^_^.... 10/14 07:01
evilove:不過原來可以這樣用random effects model,受教了:) 10/14 07:03
evilove:阿!我只有個人申請grant的總數,以及成功的總數,但是沒 10/14 07:09
evilove:有每一筆grant是成功或失敗的資料:( 10/14 07:09
bmka:you can create the variable by yourself. 10/14 09:47
bmka:之所以不建議直接分析percentage是因為每個人申請件數不同 10/14 09:52
bmka:件數多的人percentage的variability小,需要考慮weighing 10/14 09:54
evilove:對不起,不太懂你說的自己做一個變項是什麼意思?我這個是 10/14 12:50
evilove:survey的資料,一題問學者申請多少件,一題問成功多少件 10/14 12:51
evilove:所以outcome for each grant application我沒辦法知道 10/14 12:52
evilove:謝謝你的熱心~ 10/14 12:53
bmka:申請五件成功三件不就三個1兩個0,其他的covariate就複製5次 10/14 19:18
bmka:所以本來一個id行資料變成一個id m行,m是申請件數 10/14 19:21
bmka: 一 10/14 19:24
bmka:1跟0的順序對你的分析不會有影響 10/14 19:28
bmka:因為同一個cluster(由id定義)的covarite都一樣 10/14 19:30
evilove:喔喔喔,豁然開朗,真厲害!!感恩~ 10/15 00:29