一、单项选择题 (在每小题给出的四个选项中,只有一个符合题目要求。) 1. 假设男子身高服从正态分布,根据调查,2009年上海成年男子身高68%的区间估计为[167.32,175.02],据此推算,99.7%的上海成年男子的身高的区间估计是______。
A.[161.32,177.02] B.[159.62,182.72] C.[163.47,178.87] D.[155.77,186.57]
A B C D
B
[解析] 由正态分布的
准则,对于正态分布
,数值分布在
间的概率为0.68,分布在
间的概率为0.997。本题中,
即
置信区间关于样本均值对称,故样本均值
即
。不妨设99.7%的区间估计为[a,b],同理有
因此
,
。代入数据计算得,a=159.62,b=182.72。
9. 已知一总体服从指数分布,其均值为μ,取样本x
1 ,…,x
n (n>1),得到样本均值
。以下说法错误的是______。
A.μ的矩估计和极大似然估计都是 B. 是μ的充分统计量 C.在μ所有估计中, 的均方误差最小 D.当样本量趋于无穷时, 的极限是μ
A B C D
C
[解析] A项,均值为
的指数分布的密度函数为
,
,期望
故
的矩估计为
。似然函数
对数似然函数
对数似然函数关于μ求导得
令导数为零得到极大似然估计
;B项,由因子分解定理知,
所以
是μ的充分统计量;C项,均方误差即样本方差,在μ的所有估计中,
不是均方误差最小的;D项,由大数定律,当样本量趋于无穷时,
的极限是μ。
11. 一种药冷藏2年后的有效率为25%,通过改良,希望有效率提高到原来的一倍,为了检验改良效果,随机确定20名自愿者进行试验,如果20人中至少有9人以上注射后有效果,则认为改良是成功的,若低于9人,则认为改良是不成功的,这个检验的两类错误之和______。
A.小于0.5 B.在0.5与1之间 C.等于1 D.大于1
A B C D
C
[解析] 不妨用
表示该药的有效率,用p表示有效的样本比例,则有
检验的原假设
,备择假设
,拒绝域
。犯第一类错误的概率,即原假设为真拒绝原假设的概率
犯第二类错误的概率,即原假设为假而接受原假设的概率
两类错误之和
。
12. 对于方差已知为
的正态总体均值的假设检验问题:H
0 :μ=μ
0 ,H
1 :μ<μ
0 ,显著性水平取为α,样本量为n。当真实的均值为
时,检验的势为______。
A B C D
D
[解析] 检验统计量为
拒绝域为
即
检验的势为检验统计量落入拒绝域的概率。真实均值为
时,检验的势为
20. 多重比较中常使用的检验方法有两种S法和T法,下列说法正确的是______。
A.样本重复数不等用S法 B.样本重复数不等用T法 C.样本重复数不等不能用S法和T法 D.S法和T法在各种场合都可以使用
A B C D
A
[解析] 方差分析中的多重比较原假设和备择假设分别为:
。S法适用于各个水平下进行的试验次数不相同的情形。S法中,根据显著性水平α及k-1,N-k,查表得临界值
,计算
若
,则认为
与
的差异有统计学意义,反之,认为差异无统计学意义;T法适用于各个水平下进行的试验次数相同的情形。根据检验水平α及因素水平个数k和n-k,查表得临界值
,计算
若
,则认为
与
的差异有统计学意义,反之,认为差异无统计学意义。
23. 设X
1 ,X
2 ,…,X
n 是来自正态总体N(μ,σ
2 )的一个简单随机样本,σ
2 的极大似然估计为
则
的渐近分布是______
A.N(σ2 ,2σ4 ) B.N(σ2 ,σ4 ) C. D.
A B C D
C
[解析] 由正态分布的性质有,
由卡方分布的性质有
所以
当n趋于无穷大时,由中心极限定理知,
近似服从
。
26. 对两个正态总体方差的检验
有以下三个说法:
(1)当μ
1 和μ
2 均未知时,应采用F作为检验统计量
(2)当μ
1 和μ
2 均已知时,应采用F作为检验统计量
(3)当μ
1 和μ
2 其中一个已知、另一个未知时,应采用F作为检验统计量
那么,您的结论是______
A.只有(2)正确 B.(1)和(2)正确,(3)错误 C.(2)和(3)正确,(1)错误 D.(1)、(2)、(3)都正确
A B C D
D
[解析] 对两正态总体方差的检验,无论μ1 、μ2 是否已知,都应采用F作为检验统计量。
27. 在△ABC的两边AB、AC上各任取一点P、Q,则四边形PBCQ的面积的数学期望等于△ABC面积的______。
A B C D
B
[解析] 不妨设
的AB、AC两边长度分别为c、b;AP长度为
,AQ长度为
。
由题意知,随机变量
,
,且
、
相互独立。因此,
,
,
四边形PBCQ面积的期望
28. 均值μ的95%的置信区间是(-0.3,10.2),而利用同样的样本计算得均值μ的90%的置信区间是(0.5,9.4),则对假设检验问题H
0 :μ=0 vs H
1 :μ≠0,下列选项中,______最有可能是该检验P值。
A.0.0648 B.0.1296 C.0.0162 D.0.0324
A B C D
A
[解析] 均值μ的1-α置信区间为
,由区间估计的对称性知
取1-α=95%,则有
求得
。假设检验统计量为
,原假设为真时
P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率,即
查表知
,代入计算得
与A项最接近。
二、简要回答下列问题 (每小题10分,共40分) 1. 简述线性回归模型的基本假设及其检验方法。
(1)线性回归模型的基本假设:
①解释变量
是非随机变量,观测值
是常数;
②等方差及不相关的假定条件
③正态分布的假定条件
④通常为了便于数学上的处理,还要求n>p,即样本容量的个数要多于解释变量的个数。
(2)线性回归模型的检验方法:
①t检验,用于检验回归系数的显著性。
检验的原假设和备择假设:
;
检验统计量:
其中
拒绝域:给定显著性水平α,双侧检验的临界值为
,当
时拒绝原假设,认为
显著不为零;当
时接受原假设,认为
为零。
②F检验,用于检验线性回归方程的整体显著性。
检验的原假设和备择假设:
。
检验统计量:
拒绝域:当
时,拒绝原假设
,认为在显著性水平
下,
对
有显著的线性关系,也即回归方程是显著的;反之,当
时,则认为回归方程不显著。
2. 判断一组数据异常值有哪些方法?
(1)关于因变量y的异常值:
使用删除残差判断数据关于因变量y的异常值。删除残差的构造思想是,在计算第i个观测值的残差时,用删除掉这第i个观测值的其余n-1个观测值拟合回归方程,计算出第i个观测值的删除拟合值
,这个删除拟合值与第i个值无关,不受第i个值是否为异常值的影响,第i个观测值的删除残差为
删除学生化残差为
的观测值即判定为异常值。
(2)关于自变量x的异常值:
使用库克距离判断关于自变量x的异常值。库克距离的计算公式为
其中,
为帽子矩阵中主对角线的第i个元素,即杠杆值。对于库克距离大小标准的粗略判断标准是:当
时,认为不是异常值点;当
时,认为是异常值点。
3. 简述试验设计的三个基本原则。
(1)随机化原则,即被研究的样本是从总体中任意抽取的。随机化是试验分析使用数理统计方法的基石。 (2)重复性原则,即任何试验都必须可重复。重复的作用有两方面: ①降低试验误差,扩大试验的代表性; ②估计试验误差的大小,判断试验可靠程度。 (3)试验条件一致性原则,即整个试验过程中,除欲处理的试验的因素外,其他条件要求前后一致。这要求对影响试验结果的可能因素进行全面认真的分析,逐个消除无关因素,突出某一试验因素。
4. 给出t分布的定义,计算t的期望与方差,并回答当自由度趋向无穷时极限分布是什么。
(1)t分布的定义如下:
设随机变量
,
,且
与
独立,则
,其分布称为t分布,记为
,其中n为其自由度。
(2)计算t分布随机变量的期望和方差如下:
若随机变量
,则期望
方差
。
,其密度函数为
(3)随着自由度的增大,t分布的密度函数越来越接近标准正态分布的密度函数,即当自由度趋向无穷时极限分布是标准正态分布。实际应用中,一般当n≥30时,t分布与标准正态分布就非常接近。