一、单项选择题(在每小题给出的四个选项中,只有一个符合题目要求。)13. 设有两个正态总体N(μ
1,1)和N(μ
2,1),为对假设检验问题H
0:μ
1=μ
2,H
1:μ
1>μ
2进行检验,从两个总体中各抽取了样本容量为n的样本,得样本均值分别为
和
,则检验的拒绝域形式应为______。
- A.(c为常数)
- B.(c为常数)
- C.(c为常数)
- D.(c为常数)
A B C D
B
[解析] 此问题为右单侧假设检验,检验的拒绝域为:
而
,所以拒绝域形式为:
18. 已知某种商品的销售量存在周期性,其时间序列预测模型为
设X
1=30,X
2=10,X
3=40,X
4=20,X
5=50,则
=______。
A B C D
A
[解析]
二、简要回答下列问题(每小题10分,共40分)1. 在假设检验中,为什么说无论是作出接受原假设还是拒绝原假设的判断,都有可能犯错误?它们是什么样的错误?
(1)在假设检验问题中,对于原假设提出的命题,需要用统计量做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。用来做出判断的统计量是样本的函数,即用样本提供的信息进行判,也就是由部分来推断总体,故不论是做出怎样的判断都有犯错的可能。
(2)所犯的错误有两种类型,一类错误是原假设为真却被我们拒绝了,犯这种错误的概率用
表示,所以也称
错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用
表示,所以也称
错误或取伪错误。
2. 重复测量某物体的重量,得到数据
,应当采用
和
中的哪一个作为物体重量的估计为好?为什么?
(1)用
作为物体重量的估计比较好。
(2)判断估计量好坏的标准有无偏性和有效性等。设总体均值(该测量物体的真实重量)为
,方差为
,则统计量
和
的均值和方差分别如下:
因
,故
比
更有效,所以用
作为物体的估计为好。
3. 简述时间序列的乘法模型。
时间序列的成分可以分为4种,即趋势(T)、季节性或季节波动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达,而后分别进行分析。按4种成分对时间序列的影响方式不同,时间序列可分解为多种模型,如加法模型、乘法模型等。其中较常用的是乘法模型,其表现形式为:
4. 先说说矩估计的统计思想,再求出区间[α,β]上均匀分布的总体参数的矩估计。
(1)矩估计方法是用样本的矩去估计总体的矩,从而获得有关参数的估计量。
矩估计的统计思想为:
设X为随机变量,对任意正整数k,称E(X
k)为随机变量X的k阶原点矩,记为:
在矩估计方法中,令
即用样本的
阶矩去估计总体矩,这是一个包含k个未知参数
的方程组,此方程组所得解
即为参数
的矩估计值。
(2)已知X服从
上的均匀分布,则
取样本值
,则
解得
,
这就是总体参数α,β的矩估计。
三、计算与分析题(本题共50分)1. 某生产车间50名工人日加工零件数如下(单位:个)117、122、124、129、139、107、117、130、122、125、108、131、125、117、122、133、126、122、118、108、110、118、123、126、133、134、127、123、118、112、112、134、127、123、119、113、120、123、127、135、137、114、120、128、124、115、139、128、124、121。请先适当分组,在作出频率直方图,最后根据图形,判断这组数据的分布形状。
画直方图时,分组数在5到7之间比较合适,此题中选取分组数为5,加工零件个数最少为107,最多为139,则组距为(140-100)/5=8。得到分组结果如下表:
根据以上结果可得频率分布直方图:
由频率分布直方图可以看出,这组数据呈左偏分布。
某商业银行2007年各分行贷款情况见下表(单位:亿元)
某商业银行2007年各分行贷款情况
运用Excel中的“回归分析”,得到下列结果:
方差分析
根据以上结果,回答下列问题:2. 将上述表中的数据A,B,C,D,E求出:
A表示修正后的可决系数:
所以
B表示残差平方和的自由度:
。
C表示检验统计量F的值:
D表示的是
回归系数的t检验统计量的值:
E表示
的回归系数:
3. 你认为用线性回归模型的拟合原始数据是否合适?为什么?
用线性回归模型的拟合原始数据是合适的,因为无论是拟合优度还是调整后的拟合优度都较高,说明回归方程对观测值的解释程度较好;且F统计量对应p值
小于0.05,即通过了回归方程的显著性检验。
4. 写出不良贷款y与各项贷款余额x
1及累计应收贷款x
2之间线性回归方程,并解释各个回归系数的意义;
Y与
及
之间线性回归方程为:
其中,回归系数0.2784的意义为:在其他条件不变的情况下,各项贷款余额每增加一亿元,不良贷款平均增加0.2784亿元;回归系数0.1952的意义为:在其他条件不变的情况下,累计应收贷款每增加一亿元,不良贷款平均增加0.1952亿元。
5. 您认为各个回归系数是不是显著不等于0?为什么?(取显著性水平为0.05)
当显著性水平为0.05时,各个回归系数显著不等于0,因为各个回归系数的t统计量的P值均小于显著性水平0.05(两个回归系数的t统计量的P值分别为0.00044和0.03244)。
6. 找出各个回归参数的95%区间估计。
由题意知,
的回归系数的置信度为95%的置信区间为(0.1385,0.4183);
的回归系数的置信度为95%的置信区间为(0.0179,0.3724)。
7. 图中的五个字母代表五个同类元件,假设它们正常工作的概率都是P,且某个元件是否正常工作与其它元件无关,求系统正常工作的概率P。
若A元件正常工作,不论D元件是否正常工作,再考虑:
(1)若B元件正常工作,不论C、E元件是否正常工作,系统正常工作;
(2)若B元件不正常工作,则C、E元件都正常工作时,系统正常工作;
若D元件正常工作,不论A元件是否正常工作,再考虑:
(1)若E元件正常工作,不论C、B元件是否正常工作,系统正常工作;
(2)若E元件不正常工作,则C、B元件都正常工作时,系统正常工作;
综上,记系统正常工作为事件X,则: