看板 Master_D 關於我們 聯絡資訊
ABC三個學生跑資料庫抓精神疾病 A的總樣本是全部的人50幾萬,有精神疾病的人是44% B總樣本數沒A多但應該有幾十萬,精神疾病41% (老師說差不多) C總樣本是A的樣本中擷取有職業傷害的人,樣本數三萬多,精神疾病20幾%而已。 會差那麼多是因為總樣本人數C比較少的關係嗎?還是跟總樣本無關,是比例問題? 也就是說C雖然3萬多人但應該也要跟A,B一樣是40幾% -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.157.218 ※ 文章網址: https://www.ptt.cc/bbs/Master_D/M.1446709102.A.D4C.html
blence: 在考慮是不是也40%之前,已經排除職業傷害的影響了嗎 11/05 16:11
milk0925: 以下說明只是我個人淺見,略供參酌。 11/06 15:05
milk0925: 假如A和B皆是用近乎隨機取樣的方式進行抽樣(畢竟現實上 11/06 15:06
milk0925: 是很難做到完美的隨機取樣),那麼接下來我會想到的是, 11/06 15:08
milk0925: C多設定了一個條件:「有職業傷害的人」,我不知道C是怎 11/06 15:11
milk0925: 麼定義這個職業傷害的,因為"通常"如果疾病狀況比較嚴重 11/06 15:12
milk0925: 的話,可能也因此在工作的部分會有一些困難,意思也就是 11/06 15:15
milk0925: 在臨床上通常他們比較少是有工作的,所以當C多設定了 11/06 15:17
milk0925: 「有職業傷害的人」這個條件時,可能就有機會把一部份確 11/06 15:18
milk0925: 診,而且相對狀況比較嚴重的病人篩選掉了。 11/06 15:19
milk0925: 因此我會疑惑的是,C的「有職業傷害的人」這個條件,是 11/06 15:22
milk0925: 不是也同時代表著這些人在抽樣當時是有工作的? 11/06 15:23