北京信息科技大学 《统计学》课程期末考试试卷(A卷)
2007 ~2008学年第一学期
课程所在学院:经济管理学院
一、单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.下列哪个不属于一元回归中的基本假定( D )。
A.对于所有的X,误差项的方差都相同
B.误差项 服从正态分布
C.误差项 相互独立
D.
2.某组数据分布的偏度系数为负时,该数据的众数、中位数、均值的大小关系是( A )。
A.众数>中位数>均值
B.均值>中位数>众数
C.中位数>众数>均值
D.中位数>均值>众数
3.一元回归方程为y=11.64一0.25x,则下列说法中正确的是( C )。
A.自变量平均增长一个单位,因变量减少0.25个单位
B.自变量和因变量之间成正相关关系
C.
D.
4.有甲乙两组数列,则( A )数列平均数的代表性高。
A. 1< 2 1> 2,则乙数列平均数的代表性高
B. 1< 2 1> 2,则乙数列平均数的代表性低
C. 1= 2 1> 2,则甲数列平均数的代表性高
D. 1= 2 1< 2,则甲数列平均数的代表性低
5.某连续变量数列,其末组为开口组,下限为500,相邻组的组中值为480,则末组的组中值为( A )。
A.520 B.510 C.500 D.540
6.不受极端变量值影响的平均数是( D )。
A.算术平均数 B.调和平均数
C.几何平均数 D.众数
7.有20个工人看管机器台数资料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上资料编制频数分布数列应采用( A )。
A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
8.若无季节变动,则季节比率应为( B )。
A.0 B. 1 C. 大于1 D. 小于1
9.如果一个定性的变量有m类,则要引进( C )个虚拟变量。
A.m B.m+1
C.m-1 D.无法判断
10.第一组工人的平均工龄为5年,第二组为7年,第三组为10年,第一组工人数占总数的20%,第二组占60%,则三组工人的平均工龄为( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企业2007年各种产品的产量比2006年增长了8%,总生产费用增长了12%,则该厂2007年单位成本( D )
A.减少了0.62% B.增加了0.62%
C.减少了3.7% D.增加了3.7%
12.相关系数r与斜率b2的符号( A )。
A.相同 B.不同
C.无法判断
13.已知小姜买的两种股票的综合价格指数上涨了24点,本日股票的平均收盘价格为14元,前日股票的平均收盘价格为( C )
A.10.64 B.10.5
C.11.29 D.无法计算
14.若今年比去年的环比发展速度为112%,去年比前年的环比增长率为3%,那么今年比前年的平均增长率为( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增长1%的绝对值为0.54,去年比前年增长的绝对值为5,则去年比前年的增长率为( C )。
A.9.3% B.8.7%
C.10.2% D.无法计算
二、多项选择题(每小题2分,共16分)
在每小题列出的若干选项中有多个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.下列变量,属于离散变量的有( A D E F )。
A.库存产品数量 B.流动资产对流动负债的比率
C.货物总重量 D.按个计量的货物数量
E.一条收费公路上的交通量 F.公司年会的出席人数
2.指出下列数据收集属于通过实验的方法收集数据的有(A B E )
A.培训航空机票代理人的新方法与传统方法的比较结果
B.通过让两组可以比较的孩子分别使用两种不同的组装说明组装玩具来比较这两种组装说明
C.一份产品评价杂志给它的订阅者邮寄调查问卷,请他们为近期购买的产品排名
D.采访一个购物中心的顾客,询问他们为什么在那里购物
E.通过在两个可比较地区分别采用不同的方法,比较两种不同的养老金促销方法
3.下列组限的表示方法哪些是对的( A B D )。
A.按职工人数分组,相邻组的组限可以重叠,也可以间断
B.职工按工资分组,其组限必须重叠
C.学生按成绩分组,其组限必须间断
D.人按身高分组,其组限必须重叠
4.下列属于质量指标指数的有( A B D E )。
A.价格指数 B.单位成本指数
C.销售量指数 D.工资水平指数
E.劳动生产率指数
5.具体地说,如果出现下列( A B C )情况,暗示多元回归模型有可能存在多重共线性。
A.模型中各对自变量之间显著相关
B.线形关系显著,回归系数 的t检验却不显著
C.回归系数的正负号与预期相反
D.
6.算术平均数具有下列哪些性质( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在频数分布数列中( C D E )。
A.总次数一定,频数和频率成反比 B.各组的频数之和等于100
C.各组频率大于0,频率之和等于1 D.频率越小,则该组数值所起作用越小
E.频率表明各组变量值对总体的相对作用程度
8.标准差( C E )。
A.表明总体单位标志值的一般水平 B.反映总体单位的一般水平
C.反映总体单位标志值的离散程度 D.反映总体分布的集中趋势
E.反映总体分布的离中趋势
三、简答题(本大题共2题,每题5分,共10分)
1.什么是年度化增长率?它有何用途?
2.数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。( 错 )
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。( 错 )
3.连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。( 对 )
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。( 对 )
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。( 错 )
四、计算分析题(共54分)
1.将某邮局中外发邮包样本的重量近似到盎司为:21,18,30,12,14,17,28,10,16,25。计算这组数据的均值,中位数,众数,极差,四分位间距,从偏斜度的角度描述数据的分布形状(10分)。
2.表1中列出了在一个为期三周的商务统计课程中学生课外学习的小时数和他们在课程结束时的测试分数的样本数据如下:
表1 学生课外学习时间及考试分数统计表
学生样本 1 2 3 4 5 6 7 8
学习时间,X 20 16 34 23 27 32 18 22
考试分数,Y 64 61 84 70 88 92 72 77
利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
标准误差 6.157605
观测值 8
方差分析
df SS MS F Significance F
回归分析 1 658.5034 658.5034 17.36738233 0.005895457
残差 6 227.4966 37.9161
总计 7 886
Coefficients 标准误差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析并回答下列问题:
(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的? 86.21% 74.32%
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(3) 检验线性关系的显著性 。
(4) 根据标准化残差图判断关于随机误差项正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立
3.随机抽取了15家大型商场销售的同类产品的有关数据(单位:元),利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
标准误差 69.75121
观测值 15
方差分析
df SS MS F Significance F
回归分析 2 31778.15 15889.08 3.265842 0.073722186
残差 12 58382.78 4865.232
总计 14 90160.93
Coefficients 标准误差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相关系数矩阵
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
注:X Variable 1为购进价格/元
X Variable 2为销售费用/元
因变量Y为销售价格/元
(1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系? 0.3089 0.0012 没有,因为相关系数较小
(2)根据上诉结果,你认为用购进价格与销售费用来预测是否有用?没用
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。不显著
(4)解释判定系数R2,所得结论与问题(2)中是否一致? R2=35.25% , 在销售价价格的总变差中,被估计的回归方程所解释的比例是35.25%,一致。(+3)
(5)X1与X2之间的相关系数是什么?意味着什么?高度相关
(6)模型中是否存在多重共线性?你对模型有何特长建议?可能存在多重共线性;进一步检验是否存在多重共线性,对X1与X2的样本相关系数进行显著性检验(rx1x2=-0.8529),如果是显著,即可确定为存在多重共线性。(+2)
对模型有何特长建议:根据研究目的,删掉相对次要的解释变量。(+1)
4.一公司生产的三种产品的有关如下数据如下表所示 (共14分):
商品 计量单位 销售量 单价(万元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 吨 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)计算三种产品的销售额指数;
(2)计算三种产品的销售量指数;
(3)计算三种产品的单位价格指数;
(4)计算分析产量和单位价格的变动对销售额影响的相对数和绝对数。
北京信息科技大学
2007 ~2008学年第一学期
《统计学》课程期末考试试卷标准答案(A卷)
一、 单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多项选择题(每小题2分,共16分)
在每小题列出的五个选项中有二至五个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 简答题(本大题共2题,每题5分,共10分)
1. 什么是年度化增长率?它有何用途?
(1)增长率以年来表示时,称为年度化增长率或年率,(+2)
其计算公式为:
m 为一年中的时期个数;n 为所跨的时期总数
季度增长率被年度化时,m =4
月增长率被年度化时,m =12
当m = n 时,上述公式就是年增长率 (+2)
(2)可将月度增长率或季度增长率转换为年度增长率,实现增长率之间的可比性。(+1)
2. 数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。(×)
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。(×)
3.连续型变和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(√)
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。(√)
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。(×)
五、计算分析题(共55分)
中位数的位置:(10+1)/2=5.5
中位数
从偏斜度的角度描述数据的分布形状:均值>中位数,正向(右)偏
(+2)
2.(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的?
r=0.862109, (+1)
R2=0.743232, 考试分数的变差中有74.3232%是由于学习时间的变动引起的。(+2)
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(+3)
回归系数的含义表明学习时间每增加一个小时, 考试分数平均增加1.497分。(+2)
(3) 检验线形关系的显著性
Significance F=0.005895457〈 =5%
线性关系显著。(+3)
(4) 根据标准化残差图判断关于随机误差项服从正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立。(+4)
3. (1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系
(1)ryxi =0.308952067 ryx2=0.001214062,
没有证据。(+2)
(2)根据上述结果,你认为用购进价格与销售费用来预测是否有用?
没有用。(+2)
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。
Significance F=0.073722> =5%
线性关系不显著。(+3)
(4)解释判定系数R2,所得结论与问题(2)中是否一致
R2=35.25% , 在销售价价格的总变差中,被估计的回归方程所解释的比例是35.25%,一致。(+3)
(5)X1与X2之间的相关系数是什么?意味着什么?
rx1x2=-0.8529,高度相关(+2)
(6)模型中是否存在多重共线性?你对模型有何特长建议?
可能存在多重共线性;进一步检验是否存在多重共线性,对X1与X2的样本相关系数进行显著性检验(rx1x2=-0.8529),如果是显著,即可确定为存在多重共线性。(+2)
对模型有何特长建议:根据研究目的,删掉相对次要的解释变量。(+1)
4. (1)三种产品的销售额指数; (+3)
三种产品的销售额指数=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8万元
(2)三种产品的销售量指数; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2万元
(3)三种产品的价格指数; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6万元
(4) 分析产量和单位价格的变动对销售额影响的相对数和绝对数。(+5)
120.51%=118.05%*102.08% (+3)
96.8万元万元=85.2万元+11.6万元 (+2)
指标 B相对指标 C平均指标 D变异指标
10重点调查中的重点单位是指( )
A在总体单位总数中占绝大多数的单位 B具有典型意义或代表性的单位
C单位数虽少,但其指标值在总体全