二、填空1. ______是数据中出现次数最多的变量值。
众数
[解析] 众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。
2. 偏态系数(偏度)大于零时,表明数据的分布特征为______偏分布。
右/正
[解析] 偏态系数是用来测度偏态的统计量,记作SK。当一组数据的偏态系数等于0,说明一组数据的分布是对称的;当偏态系数为正,可以判断一组数据为右偏或者正偏;反之,可判断为负偏或者左偏。偏态系数的值越大,表示倾斜的程度越大。
3. 同时降低拒真错误和采伪错误概率的唯一途径是______。
增大样本容量
[解析] 在假设检验中,拒真错误和采伪错误发生的概率呈现此消彼长的关系,减小一个错误的概率就必然增大另一个错误的概率。只有增大样本量才能够同时减小两个错误发生的概率。
4. 相关系数(r)用以测定两个数值型变量______相关程度的高低。
线性
[解析] 相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。r的取值范围是[-1,1],即-1≤
≤1。若0<
≤1,表明x与y之间存在正线性相关关系;若-1≤
<0,表明x与y之间存在负线性相关关系;若
=+1,表明x与y之间为完全正线性相关关系;若
=-1,表明x与y之间为完全负线性相关关系。
5. 拉氏指数认为,计算价格总指数时。应将作为同度量因素的销售量固定在______期。
基
[解析] 拉氏指数在计算综合指数时将作为权数的同度量因素固定在基期。
三、单选1. 从均值为μ,方差为σ
2的总体中抽取容量为n的样本,当n充分大时,样本均值
近似服从______的正态分布。
- A.均值为μ,方差为
- B.均值为,方差为
- C.均值为,方差为
- D.均值为μ,方差为
A B C D
D
[解析] 根据中心极限定理可知,从均值为μ、方差为
(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值
的抽样分布近似服从均值为μ、方差为
的正态分布。
2. 未知参数θ的两个估计量
和
的方差分别为
和
。如果
,则称
为______。
- A.有效估计量
- B.一致性估计量
- C.无偏估计量
- D.数学期望
A B C D
A
[解析] 有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。假定有两个用于估计总体参数的无偏估计量,分别用
和
表示,它们的抽样分布的方差分别用D(
)和D(
)表示,如果
的方差小于
的方差,即D(
)<D(
),就称
是比
更有效的一个估计量。
4. 线性回归预测过程中,在自变量取值和置信度为一定的条件下,总是______
- A.个别值的估计区间小于平均值的估计区间
- B.个别值的估计区间大于平均值的估计区间
- C.个别值的估计区间等于平均值的估计区间
- D.个别值的估计区间与平均值的估计区间没有关系
A B C D
B
[解析] 利用估计的回归方程,对于
的一个特定值
,求出
的一个估计值的区间为估计区间。区间估计有两种类型:一是置信区间估计,它是对
的一个给定值
,求出
的平均值的估计区间,这一区间称为置信区间;二是预测区间估计,它是对
的一个给定值
,求出
的一个个别值的估计区间,这一区间称为预测区间。由置信区间和预测区间的计算公式可以得出,个别值的预测区间要比平均值的置信区间宽一些。
显著性水平
下
的置信区间为:
显著性水平
下
的置信区间为:
四、多选2. 下列哪一种表述是正确的______。
- A.其他条件不变,总体方差越大,必要的样本容量越大
- B.其他条件不变,允许误差越小,必要的样本容量越大
- C.其他条件不变,显著性水平取值越小,必要的样本容量越大
- D.其他条件不变,置信度取值越小,必要的样本容量越小
A B C D
ABCD
[解析] 在重复抽样或无限总体抽样条件下,边际误差为
令E代表所希望达到的边际误差,即
则确定样本量的公式为
其中
表示置信水平下的
统计量,
代表总体标准差。A项,样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;B项,样本量与边际误差的平方成反比,即可以允许的误差越小,所需的样本量就越大;CD两项,样本量与置信水平成正比,在其他条件不变的情况下,置信水平(置信度)越大,即显著性水平越小,z统计量的值的平方项越大,所需的样本量也就越大。
五、简述(本题共50分)1. 简述统计的基本程序和基本内容。
统计是指对某一现象有关的数据的搜集、整理、计算和分析等的活动。
(1)统计的基本程序
①统计设计:是根据统计研究的目的和研究对象的特点,明确统计指标和指标体系,以及应对的分组方法,并以分析方法指导实际的统计活动。
②收集资料:是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。
③整理资料:是将收集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。
④分析资料:是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,做出科学合理的解释。
(2)统计的基本内容
①统计工作:指收集、整理和分析客观事物总体数量方面资料的工作过程,是统计的基础。
②统计资料:统计工作所取得的各项数字资料及有关文字资料。
③统计科学:研究如何搜集、整理和分析统计资料的理论与方法。
2. 简述假设检验的基本思想。
假设检验又称“显著性检验”,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法,是通过收集到的样本数据对总体进行某种推断。在假设检验中,先对总体某个参数的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
假设检验的一般流程:
(1)首先提出原假设H0和备择假设H1。原假设H0是我们寻找证据来拒绝的假设;备选假设H1使我们寻找证据来支持的假设。
(2)确定适当的检验统计量,并计算其数值。选择哪个统计量作为检验统计量需要考虑一些因素,例如,进行检验的样本量是多还是少,总体标准差σ已知还是未知,等等。
(3)根据原假设和确定的显著性水平来构造拒绝域,判断检验统计量是否落在拒绝域之内,进而判断是否拒绝原假设。
假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生;反证法思想是先提出假设(假设检验原假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。在一次实验中,小概率事件几乎不可能发生,如果发生了则拒绝原假设,如果没有发生则不能拒绝原假设。
3. 描述数据频数分布离散趋势的统计量主要有哪些?各自有何特点?
(1)描述数据频数分布离散趋势的统计量主要有极差和四分位差、方差和标准差、离散系数、平均差。
(2)各自特点:
①一组数据的最大值与最小值之差称为极差,也称全距,用R表示:其计算公式为:
极差易受极端值影响,由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
②四分位差是一组数据的上四分位数和下四分位数之差,它反映了中间50%数据的离散程度,其值越小,说明中间的数据越集中,其数值越大,说明中间的数据越分散。它不受极端值影响,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。其计算公式为:
③方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号,然后再进行平均。方差的平方根称为标准差。方差和标准差反映各变量值与均值的平均差异,是数据离散程度最常用测度值。
④离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。离散系数消除了数据水平高低和计量单位的影响,用于对不同组别数据离散程度的比较。其计算公式为:
⑤平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数,用M
d表示。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。
根据未分组数据计算平均差的公式为:
六、计算(本大题共65分)某种电子元件的寿命X(以小时计)服从正态分布,现测得16只元件的寿命如下:
要求计算:1. 样本均值。
样本均值
2. 用于统计推断的样本方差与标准差。
样本方差
标准差
3. 变异系数(或称离散系数)。
离散系数
4. 以95%的置信度[t(15)
0.025=2.1315]估计总体均值的存在区间。
在正态总体,方差未知,均值未知的情况下,确定总体均值的置信区间利用t分布即可:
均值的95%置信区间为:X=241.5±2.1315×98.73/4=241.5±52.61
5. 今获某关于“广告形式”与“销售量”两个变量的带有空缺的方差分析表如下表所示。
单因素方差分析表 要求:填入表中空缺数值。
组间离差平方和为SSA,组内离差平方和为SSE,总离差平方和SST=SSA+SSE,则SSE=SST-SSA。由方差分析表可知,SSE=3766.67-2688.17=1078.5。
组间自由度为
,组内自由度为
,总自由度
则
组间均方差为MSA,组内均方差为MSE,
产品产量与生产费用两变量的样本数据及有关的计算结果如下表所示。
产品产量与生产费用的样本数据
要求计算:6. 相关系数。
相关系数
7. 判定系数。
用普通最小二乘法估计回归系数,
则
则产品产量对生产费用的预测方程为
因此各产量对应的生产费用预测值
如下表所示。
判定系数
8. 这是一种什么类型的相关关系?根据您的经验,这种相关关系能否推广到总体中去。
0<1,表明x与y之间存在正线性相关关系。这种相关关系能推广到总体中去,因为样本相关系数是总体相关系数的近似估计值,尽管其大小会受到抽样波动的影响,但正线性相关关系的类型是不变的。
9. 两种商品销售量和价格资料如下表所示。
两种商品销售量及价格资料 要求计算:
(1)销售量总指数。
(2)价格总指数。
(3)销售额总指数。
(4)价格及销售量理想指数。
(5)从相对数和绝对数上说明销售量和价格的变动对销售额变动的影响程度。
(1)销售量总指数
(2)价格总指数
(3)销售额总指数
(4)价格理想指数
销售量理想指数
(5)由(1)销售量变动的相对数为105.54%,表明销售量综合增长了5.54%,绝对数
即导致销售额增长的绝对数为6305元。
由(2)价格变动的相对数为114.38%,表明价格综合提高了14.38%,绝对数
即导致销售额增长的绝对数为17270元。
两因素共同影响使销售额报告期相对基期增长了5.54%+14.38%=19.92%,绝对数为6305+17270=23575元。
某商店连续6个月销售额数据如下表所示。
某商店连续6个月销售额
要求:10. 绘制时间序列动态图。
绘制时间序列动态图如下图所示。
11. 计算各个月份的环比发展速度、定基增长速度。
将6个月销售额依次记为
,
各个月份的环比发展速度分别为
,
即
,
,
,
,
。
定基增长速度=定基发展速度-1(或100%),各月份定基发展速度分别为
,
即为
,
,
,
,
。
则各月份定基增长速度分别为3.38%,8.97%,12.82%,17.64%,18.77%。
12. 计算此间的平均发展速度及平均增长速度。
此间的平均发展速度为
平均增长速度=平均发展速度-1(或100%),即为3.50%。
13. 采用3项移动平均法计算趋势值。
表中的预测值2030就是1月、2月、3月这3个月的平均值,用它作为4月的趋势值。同样,2270就是4月、5月、6月这3个月的平均值,用它作为7月的趋势值。
14. 运用最小平方法测定长期趋势,并预测第7个月份的销售额。