一、单项选择题(在每小题给出的四个选项中选择一个正确选项。)5. 设在矩形[-1,1]×[-2,2]上,f(x,y)=(α+βsinxsiny);且在此矩形之外f(x,y)=0。则f(x,y)是两个独立随机变量的联合密度函数当且仅当______。
- A.α=1/8,β=0
- B.α=1/8
- C.α=1/8,|β|≤1/8
- D.β=0
A B C D
A
[解析] x的边缘分布密度函数为
y的边缘分布密度函数为
由概率密度函数的规范性知
故α=1/8;若f(x,y)为两个独立随机变量的联合密度函数,则有
即α+βsinxsiny=
,得β=0。
10. 取自标准正态总体的样本的平方之和是______。
- A.正态分布
- B.是分布
- C.t-分布
- D.F-分布
A B C D
B
[解析] 设X
1,X
2,…,X
n是取自标准正态总体的样本,则
服从自由度为n的
分布;若Z是独立于Y的自由度为m的
分布,则
服从自由度为(m,n)的F分布;若X服从标准正态分布,则有
服从自由度为n的t分布。
11. 设总体服从参数为λ的Poisson分布。则λ的矩法估计______。
- A.是无偏估计
- B.比它的最大似然估计有效
- C.不是无偏的
- D.不是相合估计
A B C D
A
[解析] 设
,
为从总体中抽取的简单随机样本。则由
,得λ的矩法估计为
由
得λ的矩法估计为其无偏估计。
二、简要回答下列问题(每小题10分,共40分)1. 简述大数定律和中心极限定理的意义。
(1)大数定律的意义如下:
设
为随机变量序列,如果存在常数列
,使得对任意的
,有
则称随机变量序列
服从大数定律。大数定律描述的是当试验次数很大时随机事件所呈现的概率规律性,该定律表明在试验条件不变的情况下,若重复试验多次,则随机事件的频率近似等于它的概率。大数定律使对随机变量发生的概率研究得到理论依据。
(2)中心极限定理(独立同分布情形)的意义如下:
设随机变量列
相互独立,具有相同的分布,且
记
则对于任意实数x,有
中心极限定理讨论的是随机变量的和的分布以正态分布为极限的一组定理。该定理是数理统计学和误差分析的理论基础,指出了大量随机变量的极限分布,以及近似服从极限分布的条件。
2. 简述极大似然估计的思想、及其基本性质。
(1)极大似然估计的思想如下:
极大似然估计是建立在极大似然原理基础之上的统计方法,极大似然原理的直观想法是若一个随机试验有n个可能的结果,在一次试验中结果A发生了,则认为试验条件对A出现有利,即A出现的概率大。极大似然估计的思想是估计总体的参数,使得出现样本的概率达到最大。
(2)极大似然估计的性质如下:
①极大似然估计的不变性:若
是
的极大似然估计,则对于任一函数
,
是其极大似然估计;
②极大似然估计的渐进正态性:一般条件下,总体分布
中
的极大似然估计具有相合性和渐进正态性,即
其中n为样本容量
为fisher信息量。
3. 简述方差分析的研究内容、基本假定、基本思想和一般步骤。
(1)研究内容:通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响;
(2)基本假定:
①样本是相互独立的随机样本;
②各样本均来自正态总体;
③各总体方差相等;
(3)基本思想:通过分析研究不同来源的变异对总变异的贡献大小,即将总的离差平方和分解为组间离差平方和以及组内离差平方和,从而确定可控因素对研究结果影响的大小。
(4)一般步骤:
①建立检验假设H0:多个样本总体均值相等,H1:多个样本总体均值不相等或不全等;
②计算检验统计量F值,F=组间均方误差除以组内均方误差;
③给定显著性水平α;
④确定p值并作出推断结果。若p<α,则拒绝原假设。
4. 简述相关分析与回归分析的关系。
回归分析是确定两种及两种以上变量间相互依赖的定量关系的一种统计分析方法。相关分析是研究随机变量之间相关关系的一种统计学方法。两者既有联系又有区别。
(1)联系:回归分析和相关分析研究的都是变量之间的相互依赖关系,是现代统计学中关于统计关系研究的两个重要分支。
(2)区别:
①回归分析中必须有一个变量是因变量,处于被解释的特殊地位;相关分析中没有此要求,变量处于平等的地位;
②回归分析中因变量是随机变量,自变量可以是随机变量也可以是非随机变量,通常假定自变量是非随机的;相关分析中涉及到的变量均为随机变量;
③相关分析的研究主要是为刻画两个变量间线性相关的密切程度;回归分析不仅可以揭示自变量对因变量的影响大小,还可以由回归方程进行预测和控制。
三、计算与分析题(本大题共50分)1. 计算机在进行加法运算时,对每个加数取整(取为最接近于它的整数),设所有的取整误差相互独立且都服从区间(-0.5,0.5)上的均匀分布。求在1500个数相加时,误差总和的绝对值超过15的概率。
设
为取整误差,则依题意有:
,
分别为这1500个数的取整误差。
由中心极限定理知
近似服从标准正态分布,其中
,
故
所以,在1500个数相加时,误差总和绝对值超过15的概率为
。
己知某种合成橡胶的拉伸强度X服从正态分布N(221,52)。现在改变了工艺条件后,抽取了10个样品,测得其样本均值=219。2. 问在显著性水平α=0.05下能否认为改变工艺后其拉伸强度有显著变化(Φ(1.96)=0.975,Φ(1.64)=0.95)。
由于总体方差已知2,故采用Z检验统计量进行假设检验,过程如下:
①提出假设:
②构造检验统计量:
③给出拒绝域形式:
④代入数据计算得:Z=-1.89,
故不能拒绝原假设。认为改变工艺后其拉伸强度没有显著变化。
3. 如果改变工艺后的真实拉伸强度的均值为217,试在α=0.05下计算犯第二类错误的概率。
犯第二类错误的概率β为取伪的概率,即原假设为假但没有拒绝原假设的概率。
所以,在α=0.05下计算犯第二类错误的概率为
。
已知下列数据组
4. 建立—元线性回归模型;
,
;
,
;
,
,
。
回归系数
截距项
。
故一元线性回归方程为
5. 计算相关系数R,取显著性水平α=0.05,对回归模型进行显著性检验(R
0.05(6)=0.7067,R
0.05(7)=0.6664)。
相关系数
回归系数与相关系数之间的关系为
对回归模型进行显著性检验采用F统计量,过程如下:
①提出假设:
②构造检验统计量:
③给出拒绝域:当
时拒绝原假设;
④经计算得
因此,拒绝原假设,认为线性回归模型的系数是显著的。