一、简答题1. 简述普查的特点。
普查是专门组织的一种全面调查。对重大国情国力的调查一般采用普查。其特点为:①普查是全面调查,普查数据具有信息全面、完整的特点,比其他任何一种调查形式都能掌握大量、详细、全面的统计数据;②普查涉及范围广,接受调查的单位多,因此耗时、费力,调查的成本也非常高,因此不可能经常进行,是非经常性的调查。
2. 解释估计量的无偏性、有效性、一致性。
(1)无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。即如果
,称
为θ的无偏估计量。如
,E(p)=π,E(s
2)=σ
2。
(2)有效性。对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。
(3)一致性。一致性是指随着样本量的增大,估计量的值越来越接近总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数,用公式表示就是
。
3. 简述时间序列的成分。
时间序列的构成要素有:
T(长期趋势):长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性。它是时间序列中最基本的构成因素;长期趋势按变化方向不同来分,有上升趋势、下降趋势和水平趋势三类;按变化的形态来分,长期趋势可分为线性趋势和非线性趋势两类。
S(季节变动):泛指现象在一年内所呈现的较有规律的周期性起伏波动。周期长度可以是一年,也可以小于一年。
C(循环变动):指在较长时间内(通常为若干年)呈现出涨落相间、峰谷交替的周期性波动。它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,而循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。
I(不规则变动):是没有规律可寻的变动,它是从时间序列分离了长期趋势、季节变动和循环变动之后剩余的因素。
乘法模型: yt=Tt×St×Ct×It
4. 相互独立的概念是什么?三个事件相互独立和三个事件两两独立一样么?为什么?
对于两个事件A和B,假若事件B的发生并不影响事件A发生的概率,称事件A与B之间统计独立,即在A与B独立时显然有P(A|B)=P(A),这时,乘法公式P(AB)=P(B)P(A|B)=P(A)P(B)。
三个相互独立和三个事件两两独立不一样。因为三个事件两两独立只要求P(AB)=P(A)·P(B),P(AC)=P(A)P(C),P(BC)=P(B)P(C),而三个事件相互独立不但要求P(AB)=P(A)·P(B),P(AC)=P(A)P(C),P(BC)=P(B)P(C),而且要求P(ABC)=P(A)P(B)P(C)。
5. 根据经济学理论,一般商品的需求量与其价格呈反向变动关系。可是,观察我国水产品销售量和其价格的时间序列数据,会发现两者之间呈现正相关关系。试利用单相关和偏相关的概念,分析和说明这一现象产生的原因。
我国水产品销售量和其价格的时间序列数据之间呈现的正相关关系属于单相关。影响水产品销售量的主要因素除了价格外,还有收入水平等。由于近年来,我国居民的收入水平大幅度上升,因此,尽管水产品价格上涨很快,但水产品的需求量和销售量仍然增长迅速。
要准确考察水产品销售量和价格之间的关系,应求偏相关系数,将其他影响因素控制起来,研究水产品销售量与价格之间的净相关关系。或采用多元回归分析,将价格和收入作为销售量的解释变量建立回归模型,对偏回归系数进行相应检验,以分析销售量与价格之间的偏相关关系。
二、计算题一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,收集到30个地区的有关数据。利用Excel得到下面的回归结果(α=0.05),方差分析表见表1,参数估计表见表2。 表1 方差分析表 |
变差来源 | df | SS | MS | F | Significance F |
回归 | | | 4008924.7 | | 8.88341E-13 |
残差 | | | | — | — |
总计 | 29 | 13458586.7 | — | — | — |
表2 参数估计表 |
| Coefficients | 标准误差 | t Stat | P-value |
intercept | 7589.1025 | 2445.0213 | 3.1039 | 0.00457 |
X Variable 1 | -117.8861 | 31.8974 | -3.6958 | 0.00103 |
X Variable 2 | 80.6107 | 14.7676 | 5.4586 | 0.00001 |
X Variable 3 | 0.5012 | 0.1259 | 3.9814 | 0.00049 |
要求:1. 将方差分析表中的所缺数值补齐;
变差来源
|
df
|
SS
|
MS
|
F
|
Significance F
|
回归
|
3
|
12026774.1
|
4008924.7
|
72.797
|
8.88341E-13
|
残差
|
26
|
1431812.6
|
55069.7
|
—
|
—
|
总计
|
29
|
13458586.7
|
—
|
—
|
—
|
2. 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义;
解:
表示在各地区年人均收入和广告费用不变的情况下,销售价格每提高1个单位,销售量将随之平均下降117.8861个单位;
表示在销售价格和广告费用不变的情况下,年人均收入每提高1个单位,销售量将随之平均增加80.6107个单位;
表示,在销售价格和各地区年人均收入不变的情况下,广告费用每提高1个单位,销售量将随之平均增加0.5012个单位。
3. 检验回归方程的线性关系是否显著;
解:在F检验中,由于Significance F=8.88341E-13<α=0.05,拒绝原假设,故回归方程的线性关系显著。
4. 计算判定系数,并解释它的实际意义;
解:判断系数
,说明在销售量的总变差中,可以由回归方程所解释的比例为89.36%,拟合效果良好。
5. 计算估计标准误差,并解释它的实际意义。
解:估计标准误差
,表明用销售价格、年人均收入和广告费用来预测销售量时,平均的预测误差为234.6693。
从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。要求:6. 假如总体的标准差为10.5元,那么抽样平均误差是多少?
解:抽样平均误差
(元)
7. 95的概率保证下,抽样极限误差是多少?极限误差说明什么问题?
解:抽样极限误差
;抽样极限误差说明的是推断中的允许误差范围。
8. 总体平均消费额95%的置信区间是多少?
解:总体平均消费额的95%置信区间为
,即(22.56,28.44)。
某校招生情况见下表。 某校招生情况表 |
| 男 生 | 女 生 |
工科 | 财经科 | 合计 | 工科 | 财经科 | 合计 |
录取人数 | 300 | 50 | 350 | 100 | 100 | 200 |
报考人数 | 600 | 200 | 800 | 200 | 400 | 600 |
录取率(%) | — | — | 43.75 | — | — | 33.33 |
有人根据表中该校合计平均男女生录取率的差别,指责该校在招生工作中对女生有歧视。9. 你认为这一指责是否成立,并说明理由。
这一指责不能成立,因为从学科来看,在工科中男生录取率为300/600=50%,女生100/200=50%;在财经科中,男生录取率为50/200=25%,女生录取率为100/400=25%。造成男生总的录取率高于女生的原因是,男生报考录取率高的工科比重较大,而女生则报考录取率低的财经科比重较大。
10. 试利用平均指标变动的因素分析原理,对男生平均录取率高于女生的原因进行定量分析。
解:将原表转换为下表:
|
录取率x/(%)
|
报考人数f
|
男x0
|
女x1
|
男f0
|
女f1
|
工科
|
50
|
50
|
600
|
200
|
财经科
|
25
|
25
|
200
|
400
|
合计
|
—
|
—
|
800
|
600
|
将男生设为0,女生设为1,则
男生平均录取率
女生平均录取率
1)总平均水平指数
总录取率的差额为
33.33%-43.75%=-10.42%
2)固定构成指数(或组水平变动指数)
各学科录取率对总录取率的影响为
33.33%-33.33%=0
3)结构影响指数
男女各科报考人数对总录取率的影响为
33.33%-43.75%=-10.42%
4)相对数关系:
76.18%=100%×76.18%
绝对数关系:
-10.42%=0+(-10.42%)
由此可见,男女录取率差别的原因完全是由男女报考不同学科人数比重不同造成的。
11. 某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者,得到下表所示数据。
阅读习惯与文化程度列联表 |
阅读习惯 | 大学以上 | 大学和大专 | 高中 | 高中以下 |
早上看 | 6 | 13 | 14 | 17 |
中午看 | 12 | 16 | 8 | 8 |
晚上看 | 38 | 40 | 11 | 6 |
有空看 | 21 | 22 | 9 | 13 |
以0.05的显著性水平检验读者的阅读习惯是否与其文化程度有关。
解:H
0:行列变量相互独立(阅读习惯与文化程度不存在依赖关系)
H
1:行列变量不独立(阅读习惯与文化程度存在依赖关系)
P值=0.00021<α=0.05,故拒绝原假设,即读者的阅读习惯与其文化程度有关。
12. 国际市场上每年对我国某种商品的需求量(单位:吨)服从[2000,4000]上的均匀分布。若每出售1吨可获得外汇3万美元,如果销售不出,则会造成该商品积压,每吨需要保养费1万美元。求应组织多少货源,才能使平均收益最大?
解:设随机变量X表示国际市场每年对我国某种商品的需求量,Y表示平均收益,组织的货源为a吨,根据题意有
三、论述题1. 试述统计调查方案应包括的内容。
统计调查方案一般包括以下内容:
(1)明确调查目的。确定调查目的就是明确调查要解决什么问题,只有明确调查目的,数据的搜集工作才能有序进行。
(2)确定调查对象和调查单位。调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,是进行调查登记的标志的承担者。
对于抽样调查,确定调查对象就是明确目标总体,这是建立抽样框的前提。进行抽样调查方案设计,还应包括确定样本量的大小,样本的抽取方式和抽样的组织形式。
(3)设计调查项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志构成。
(4)设计调查表格和问卷。将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。利用调查表,不仅能够有条理地填写需要收集的资料,还便于调查后对资料进行汇总整理。
(5)确定调查时间。统计调查时间包括两种含义:调查时间和调查期限。
调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期;如果所要调查的是时点现象,调查时间就是规定的统一标准时点。
调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。
(6)组织实施调查计划。调查组织工作包括确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调查数据的处理方法、报送方式和公布调查结果的时间。
(7)调查报告的撰写。调查报告包括调查过程的描述、依调查数据所做的决策和调查结果的评价。在调查方案中,应给出提交调查报告的具体时间,并对调查的精度、费用等提出具体要求。
2. 试述抽样实际误差、抽样平均误差与抽样极限误差的含义。
(1)抽样实际误差是指在某一次抽样中,由于随机因素引起的样本统计量与总体参数之间的数量差异。如:
。
实施抽样调查时,因为总体参数是未知的,所以抽样实际误差实际上无法计算。即使可以计算,而在总体相当大,可能形成的样本非常多的情况下,不可能列出所有的实际误差。
(2)抽样平均误差(抽样标准误差)是样本均值(或样本成数)的标准差。它反映样本均值(或样本成数)与总体均值(或总体成数)的平均误差程度。
抽样平均误差的计算的方法原则上是一致的,但不同的抽样组织形式和不同的抽样方法,计算抽样平均误差各有其特点。现以简单随机抽样为例,说明抽样平均误差的计算方法。
简单随机抽样下抽样平均误差的计算公式见下表:
(3)抽样极限误差是所有可能样本统计量与总体参数的误差平均值,由于样本是随机的,随着样本的不同,样本统计量也有变化。因此,它与总体参数之间的误差也随之变化。进行抽样调查时,抽到的只是所有可能样本中的一个,这个样本统计量与总体参数之间的误差可能大于、小于、等于抽样平均误差,这样就无法确定某一次样本统计量与总体参数的误差数值的准确值,也就是说,样本统计量可能在这个范围之内,也有可能不在这个范围之内,这种可能性是用概率来表示的,这个误差范围称为极限误差。即:用一定的概率保证,样本统计量与总体参数的误差范围不超过某一给定的数值,这一给定的数值称为极限误差,公式为
。