一、单项选择题3. 设随机变量X和Y独立同分布,其分布为正态分布
,则
分布为______。
- A.自由度为1,1的F分布
- B.自由度1,2的F分布
- C.自由度为2,1的F分布
- D.自由度2,2的F分布
A B C D
A
[解析] 随机变量X和Y独立同分布,
,
,则有
即
因此
4. 某个班级有6个女生和10个男生,现随机组成8个小队进行比赛,每小队两个人,记X为两个人都是女生的小队个数,则E(X)=______。
A B C D
B
[解析] 两个人都是女生的小队个数即X的取值可能为0、1、2、3。总共有可能分组情形
其中,
包含情形
包含情形
包含情形
包含情形
因此
8. 某零件的9个样品的长度(单位:cm)分别为:9.8,10.2,10.3,10.1,9.6,10.2,9.7,10.3,9.8。假设该零件长度服从正态分布
,则μ的95%置信区间为______。
- A.[9.8355,10.1645]
- B.[9.804,10.196]
- C.[9.815,10.185]
- D.[9.704,10.296]
A B C D
B
[解析] 已知总体服从正态分布,且总体方差已知,n=9为小样本,此时仍可选用
统计量,且有
则总体均值μ的95%置信区间为:
代入数据可得
厘米,又
,因此
的95%置信区间为:
。
9. 样本
,...,
为来自总体
的样本,考虑如下假设检验问题:
拒绝域取为
,若使该检验犯第二类错误的概率不大于0.025,则样本量至少取为______。
A B C D
C
[解析] 犯第二类错误的概率
解得:
,即样本量至少取为97。
10. 对于线性回归模型,
,假设
的第一列的元素全为1,且
为y的最小二乘预测值。定义
那么______。
- A.A=B
- B.A>B
- C.A<B
- D.A和B大小关系不确定
A B C D
A
[解析] 对于线性回归模型,由普通最小二乘估计的过程知
因此
二、简答题(每小题10分,共20分)1. 给出数学期望和中位数的定义,试比较数学期望和中位数的优缺点。
中位数是一组数据排序后处于中间位置上的变量值。中位数主要用于测度顺序数据的集中趋势,当然也适用于作为数值型数据的集中趋势,但不适用于分类数据。中位数是一个位置代表值,其特点是不受极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。平均数也称为均值或数学期望,它是一组数据相加后除以数据的个数得到的结果。平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。
2. 给出假设检验问题中第一类错误和第二类错误的定义,试解释它们之间的关系。
拒真错误是假设检验中的第一类错误,是指原假设H0为真却被拒绝了,犯这种错误的概率用α表示,所以也称α错误。
采伪错误是假设检验中的第二类错误,是指原假设不正确而接受原假设的错误,犯这种错误的概率用β表示,所以也称β错误。
二者关系:在样本容量不变的条件下,α与β常常呈现反向的变化,即如果减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小,只有增大样本量。但样本量不可能没有限制,否则就会使抽样调查失去意义,因此,在假设检验中,就有一个对两类错误进行控制的问题。一般来说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。在假设检验中,通常首先控制犯α错误,这样做最主要的原因是,从实用的观点看,原假设是什么常常是明确的,而备择假设是什么则常常是模糊的。