課程名稱︰生物統計學一
課程性質︰系必修
課程教師︰洪弘
開課學院:醫、公衛學院
開課系所︰藥學、公衛、護理、醫技等
考試日期(年月日)︰101.10.30
考試時限(分鐘):2小時
是否需發放獎勵金:是
(如未明確表示,則不予發放)
試題 :
一、複選題
1. 下列關於信賴區間(confidence interval)的敘述,何者錯誤?
(1) 95%信心水準是指隨機抽取一參數值,則該數值有0.95的機率落入所建立的信賴區
間
(2) 是一個隨機的統計量
(3) 隨機建立100個95%的信賴區間,總是會有5個沒有包括真正的參數
(4) 樣本固定時,若需要較高的信心水準(confidence level),則信賴區間會較寬
(5) 在固定的信心水準下,樣本數越多信賴區間會越窄
2. 假設 X~Binomial(n,p),下列何者錯誤?
(1) 為一離散型分布
(2) 可用來描述族群中常見疾病的分布,但不能用在稀有疾病
(3) pmf的最大值會正好發生在X的期望值那一點
(4) 依其參數的不同,可能為對稱分布,也可能為右偏或左偏分布
(5) 當n=1時就是伯努利分布(Bernoulli distribution)
3. 假設 X~N(μ,σ^2),下列何者錯誤?
(1) pdf為一鐘型對稱曲線
(2) 跟t分布相比,較不易發生極端值
(3) Var(5X)=5σ^2
(4) X不可能出現比期望值大過三倍標準差的數值
(5) 中位數(median)和眾數(mode)都為μ
二、計算問答題
4. 從上學期生統一的學生200人中隨機抽取了一百人,這一百人的平均成績是71,中位數
是82,標準差是11,其他百分位的值分別列於下:
------------------------------------------------------------------------------
百分位數 min 3% 5% 10% 25% 50% 75% 90% 95% 97% max
------------------------------------------------------------------------------
百分位值 20 48 49 55 72 82 88 90 96 97 99
------------------------------------------------------------------------------
(1). 請畫出以上成績分布的盒鬚圖(boxplot)
(2). 請問全班中成績可稱為極端值的人數有多少,為什麼?
(3). 隨機抽取兩學生,請問這兩人得分都落在Q1和Q3之間的機率為多少?
5. 令Y代表某醫院每周嬰兒早產的人數。假設Y服從 Poisson(16)。
(1). 請問每周早產兒的個數正好等於Y的期望值的機率為多少?(寫出算式即可)
(2). 請問在未來四周內,早產兒的個數介於48至72之間的機率是多少?請先寫出正確的式
子,再用常態分配逼近的方式求出機率的近似值(小數點兩位)
6. 吾人想了解台大學生血壓之平均值,隨機抽樣若干學生。
(1). 在此問題中,母體是什麼?感興趣的參數是什麼?請你建議一個適當的機率模型以
描述母體的行為,並寫出你建議此模型的理由。
(2). 若隨機抽取100人得平均血壓值105,變異數25。請建立全校學生血壓平均值平均數值
的90%信賴區間,並解釋此信賴區間的意義。
(3). 若想要求得長度不超過20的99%信賴區間,請問應該隨機抽取多少人?
7. The following table is the summary of a case-control study.
------------------------------------------------------------
' 'Disease(D)'Non-Disdease(D-bar)'Total'
'---------------------'----------'-------------------'-----'
'With gene-G(E) ' 35 ' 65 ' 100 '
'---------------------'----------'-------------------'-----'
'Without gene-G(E-bar)' 15 ' 85 ' 100 '
'---------------------'----------'-------------------'-----'
'Total ' 50 ' 150 ' 200 '
'---------------------'----------'-------------------'-----'
(1). Based on this table, calculate the odds ratio(OR) for E and E-bar, and
the relative risk(RR).
Can we use both of the obtained OR and RR to make inference? Why? When
can you conclude that OR is an approaximation of RR?
(2). Assume the number of diseased patients in the sub-population "With gene-G
" follows Binomial(n_1,p_1).What is n_1? What is the meaning of p_1?
Please provide both point and interval(confidence level 95%) estimate for
p_1.
(3). Suppose the number of diseased patients in the sub-population "Without
gene-G "follows Binomial(n_2,p_2).Please provide a 99% conifidence
interval for p_1-p_2. Do you think gene-G is a critical factor for being
diseased? What is your reason?
8. (1) Let X~Bernoulli(p). Please derive that E(X)=p and Var(X)=p(1-p).
(2) Assume Y~Binomial(n,p). Please use the results of (1) to show that
E(Y)=np and Var(X)=np(1-p).
9. Let{X_1,...,X_n} be independent random variables with E(X_i)=μ and
Var(X_i)=σ^2. Please state the Central Limit Theorem(CLT).
試題結束
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.211.224