计算题1. 某农村信用社按定期存款账号进行每隔10户的系统抽样,得到如下表资料。试计算定期储蓄存款的众数。
系统抽样 |
存款金额(元) | 户数(户) | | 存款金额(元) | 户数(户) |
1000以下 | 30 | 4000~5000 | 10 |
1000~2000 | 150 | 5000以上 | 10 |
2000~3000 | 250 | 合计 | 500 |
3000~4000 | 50 | | |
解:由于各组组距相等,出现次数最多的是存款金额2000~3000元一组,因此众数落在第三组内。L=2000,U=3000,i=1000,d
1=250-150=100,d
2=250-50=200。
根据下限公式计算,

。
若用上限公式计算,则

(元)。
2. 某生产车间120名工人生产某种零件的日产量分组资料如表所示,计算该车间工人日产量的中位数。
生产某种零件日产量分组资料 |
按日产量分组(件) | 工人数(人) | 向上累计 |
20 | 10 | 10 |
22 | 12 | 22 |
24 | 25 | 47 |
26 | 30 | 77 |
30 | 18 | 95 |
32 | 15 | 110 |
33 | 10 | 120 |
合计 | 120 | — |
解:

,观察向上累计次数,首次超过60的是77,其对应组即为中位数组,由此中位数M
e=26件。
3. 在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元)。要求计算人均月收入的中位数与四分位数。
1500,750,780,1080,850,960,2000,1250,1630
解:先将上面的数据排序,结果如下:
750,780,850,960,1080,1250,1500,1630,2000

,所以中位数为1080,即M
e=1080(元)。

,即Q
L在第2个数值(780)和第3个数值(850)之间0.25的位置上,因此Q
L=780+(850-780)×0.25=797.5(元)。

,即Q
U在第6个数值(1250)和第7个数值(1500)之间0.75的位置上,因此Q
U=1250+(1500-1250)×0.75=1437.5(元)。
一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如表所示 年龄分布数据 |
15 16 17 18 19 | 19 19 20 20 21 | 22 22 23 23 23 | 24 24 25 27 29 | 30 31 34 38 41 |
4. 画出该组数据的茎叶图。
解:该组数据的茎叶图如图1所示。
图1 茎叶图
5. 画出该组数据的箱线图。
解:由表中数据可得:最大值=41,最小值=15,

,所以中位数=23。
下四分位数

,即Q
L第6个数值(19)和第7个数值(19)之间0.25的位置上,Q
L=19×0.75+19×0.25=19或Q
L=19+(19-19)×0.25=19。
上四分为数

,即Q
U在18个数值(25)和第19个数值(27)之间0.75的位置上,Q
U=25×0.25+27×0.75=26.5或Q
U=25+(27-25)×0.75=26.5。
由以上数据可得箱线图,如图2所示。

图2 箱线图
6. 根据茎叶图和箱线图说明上网者年龄分布的特征。
解:由茎叶图和箱线图可以看出,上网者年龄大多在20岁左右,其分布为右偏分布。
7. 一位投资者持有一种股票,连续4年的收益率分别为4.5%,2.1%,25.5%,1.9%,要求计算该投资者在这4年内的平均收益率。若该投资者最初投入10000元,第4年的本利总和是多少?
解:

即该投资者的投资年平均收益率为8.0787%。
8. 甲乙两个企业生产三种产品的单位成本和总成本资料如表所示。
单位成本和总成本资料 |
产品名称 | 单位成本 (元) | 总成本(元) |
甲企业 | 乙企业 |
A | 15 | 2100 | 3255 |
B | 20 | 3000 | 1500 |
C | 30 | 1500 | 1500 |
要求:比较两个企业的总平均成本哪个高,并分析其原因。
解:

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
9. 某企业2013年3月1日对15名员工的调查表明,他们从居住地到达工作地点花费的时间如下(分钟):10,55,70,25,30,45,30,50,25,40,55,90,40,60,70。
(1)计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平?为什么?
(2)根据以上数据给出数据的茎叶图。
(3)绘制以上数据的简单箱线图。
(4)根据以上计算和图形分析数据分布的特征。
解:(1)对数据进行排序:10,25,25,30,30,40,40,45,50,55,55,60,70,70,90。均值

(分钟),众数M
o=25,30,40,55,70(分钟),中位数为第8个数值,M
e=45(分钟)。其中均值最能反映这组数据的一般水平,因为均值是集中趋势的最主要测度值,且该组数据中不存在明显极端值,均值能较准确地反映这组数据的中心值。
(2)茎叶图如表所示。
树茎
|
树叶
|
数据个数
|
1
|
0
|
1
|
2
|
55
|
2
|
3
|
00
|
2
|
4
|
005
|
3
|
5
|
055
|
3
|
6
|
0
|
1
|
7
|
00
|
2
|
9
|
0
|
1
|
茎叶图
|
(3)题目数据中,最大值=90,最小值=10,中位数=45。
下四分位数Q
L的位置=15/4=3.75,因此Q
L=25+0.75×(30-25)=28.75。
上四分位数Q
U的位置=15×(3/4)=11.25,因此Q
U=55+0.25×(60-55)=56.25。
简单箱线图见下图。
简单箱线图
一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15。
要求:10. 计算汽车销售量的众数、中位数和平均数。
解:10名销售人员5月份销售的汽车数量中,销售10台汽车的人数最多,为3人,因此众数M
o=10。

,所以M
e=10×0.5+10×0.5=10(台)。

。
11. 根据定义公式计算四分位数。
解:

,即Q
L第2个数值(4)和第3个数值(7)之间0.5的位置上,因此Q
L=4×0.5+7×0.5=5.5(台)。
由于

,即Q
U在第7个数值(12)和第8个数值(12)之间0.5的位置上,因此Q
U=12×0.5+12×0.5=12(台)。
12. 计算销售量的标准差。
解:

13. 说明汽车销售量分布的特征。
解:由于平均数小于中位数和众数

,所以汽车销售量为左偏分布。
甲乙两个班级统计学考试成绩资料如下:甲班的平均分数为75分,标准差为7分;乙班的考试成绩频数分布表如表所示。 成绩频数分布 |
分数(分) | 人数(人) | | 分数(分) | 人数(人) |
60以下 | 4 | 80~90 | 7 |
60~70 | 8 | 90以上 | 0 |
70~80 | 13 | | |
要求:14. 计算乙班的平均考试分数。
解:乙班平均考试分数计算过程如表1所示。
表1 乙班分数计算过程
|
分数(分)
|
组中值Mi
|
人数(人)fi
|
Mifi
|
60分以下
|
55
|
4
|
220
|
60~70
|
65
|
8
|
520
|
70~80
|
75
|
13
|
975
|
80~90
|
85
|
7
|
595
|
90以上
|
95
|
5
|
475
|
合计
|
—
|
37
|
2785
|

16. 计算乙班考试分数的离散系数。
解:

17. 比较甲乙两个班级考试分数的离散程度的大小。
解:

,v
甲<v
乙,说明两个班的统计学考试成绩相比较,甲班的成绩较集中,乙班的成绩较分散。
某地区家庭按人均收入水平分组资料如表所示。 按人均收入水平分组 |
按月收入水平分组(元) | 家庭数(户) | | 按月收人水平分组(元) | 家庭数(户) |
400~600 | 20 | 1000以上 | 10 |
600~800 | 45 | 合计 | 100 |
800~1 000 | 25 | | |
计算:18. 众数和中位数。
解:由表中数据可知,众数在600~800这一组内。则由计算众数的公式可得

由计算中位数的公式可得

20. 标准差系数。
解:

21. 甲,乙两单位职工的工资资料如表所示。要求:比较哪个单位的职工工资差异程度小?
工资资料 |
甲单位 | | 乙单位 |
月工资(元) | 职工人数(人) | 月工资(元) | 职工人数(人) |
600以下 | 2 | 600以下 | 1 |
600~700 | 4 | 600~700 | 2 |
700~800 | 10 | 700~800 | 4 |
800~900 | 7 | 800~900 | 12 |
900~1000 | 6 | 900~1000 | 6 |
1000~1100 | 4 | 1000~1100 | 5 |
合计 | 33 | 合计 | 30 |
解:甲、乙两单位职工工资的均值和标准差分别为

所以,甲、乙两单位职工工资的离散系数分别为

,

,因为v
甲>v
乙,所以乙单位职工的工资差异程度小。
随机抽取25个网络用户,得到他们的年龄数据如表所示。 用户年龄数据 单位:周岁 |
19 23 30 23 41 | 15 21 20 27 20 | 29 38 19 22 31 | 15 22 19 34 17 | 24 18 16 24 23 |
要求:22. 计算众数、中位数。
解:对表中数据按从小到大顺序排列:15 16 17 18 19 19 19 20 20 2122 22 23 23 23 24 24 25 27 29 30 31 34 38 41。
由排序数据可知,年龄出现频数最多的是19和23,都出现三次,所以有两个众数,即M
o=19和M
e=23。由于

,所以M
e=23。
23. 计算平均数和标准差。
解:

24. 计算偏态系数和峰态系数。
解:

25. 对网民年龄的分布特征进行综合分析。
解:对网民年龄的分布特征进行综合分析的结果如下:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,并且偏态系数大于1,所以偏斜程度很大。峰态系数为正值,所以为尖峰分布。