《统计学(贾5)课后练答案(11-14章).doc》由会员分享,可在线阅读,更多相关《统计学(贾5)课后练答案(11-14章).doc(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流统计学(贾5)课后练答案(11-14章).精品文档.第11章 一元线性回归分析11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。(2)(3) 检验统计量,拒绝原假设,相关系数显著。11.2 (1)散点图(略)。11.3 (1)表示当时的期望值。(2)表示每变动一个单位平均下降0.5个单位。11.4 (1)(2)11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离x825 215 1070 55
2、0 480 920 1350 325 670 1215运送时间y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:(1)可能存在线性关系。(2)相关性 x运送距离(km)y运送时间(天)x运送距离(km)Pearson 相关性1.949(*)显著性(双侧)0.000N1010y运送时间(天)Pearson 相关性.949(*)1显著性(双侧)0.000N1010*. 在 .01
3、水平(双侧)上显著相关。有很强的线性关系。(3)系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)0.0040.0000.9498.5090.000a. 因变量: y运送时间(天)回归系数的含义:每公里增加0.004天。11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP(元) 人均消费水平(元) 北京 辽宁 上海 江西 河南 贵州 陕西 22 460 11 226 34 547 4 851 5 444 2 662 4 549 7 326 4 490 11 54
4、6 2 396 2 208 1 608 2 035要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(a=0.05)。 (6)如果某地区的人均GDP为5 000元,预测其人均消费水平。 (7)求人均GDP为5 000元时,人均消费水平95的置信区间和预测区间。解:(1)_可能存在线性关系。(2)相关系数:相关性 人均GDP(元)人均消费水平(元)
5、人均GDP(元)Pearson 相关性1.998(*)显著性(双侧)0.000N77人均消费水平(元)Pearson 相关性.998(*)1显著性(双侧)0.000N77*. 在 .01 水平(双侧)上显著相关。有很强的线性关系。(3)回归方程:系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。(4)模型摘要模型RR 方调整的 R 方估计的标准差1.998(a)
6、0.9960.996247.303a. 预测变量:(常量), 人均GDP(元)。人均GDP对人均消费的影响达到99.6%。(5)F检验:ANOVA(b)模型 平方和df均方F显著性1回归81,444,968.680181,444,968.6801,331.692.000(a)残差305,795.034561,159.007合计81,750,763.7146a. 预测变量:(常量), 人均GDP(元)。b. 因变量: 人均消费水平(元)回归系数的检验:t检验系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.
7、3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)(6)某地区的人均GDP为5 000元,预测其人均消费水平为2278.10657元。(7)人均GDP为5 000元时,人均消费水平95的置信区间为1990.74915,2565.46399,预测区间为1580.46315,2975.74999。11.7(1) 散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量(P-Value=0.001108,认为线性关系显著。(2)回归系数的显著性检验:假设:H0:=0 H1:0t
8、=24.72=2.36,认为y与x1线性关系显著。(3)回归系数的显著性检验:假设:H0:=0 H1:0t=83.6=2.36,认为y与x2线性关系显著。 12.4 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据: 月销售收入y(万元) 电视广告费用工:x1 (万元) 报纸广告费用x2(万元) 96 90 95 92 95 94 94 94 50 20 40 25 30 35 25 30 1.5 20 152.5 33 23 42 25要求: (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方
9、程。 (2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。 (4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(a=0.05)。解:(1)回归方程为:(2)回归方程为:(3)不相同,(1)中表明电视广告费用增加1万元,月销售额增加1.6万元;(2)中表明,在报纸广告费用不变的情况下,电视广告费用增加1万元,月销售额增加2.29万元。(4)判定系数R2= 0.919,
10、调整的= 0.8866,比例为88.66%。(5)回归系数的显著性检验:Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept83.230091.57386952.882484.57E-0879.1843387.2758579.1843387.27585电视广告费用工:x1 (万元)2.2901840.3040657.5318990.0006531.5085613.0718061.5085613.071806报纸广告费用x2(万元)1.3009890.3207024.0566970.0097610.476
11、5992.1253790.4765992.125379假设:H0:=0 H1:0t=7.53=2.57,认为y与x1线性关系显著。(3)回归系数的显著性检验:假设:H0:=0 H1:0t=4.05=2.57,认为y与x2线性关系显著。12.5 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下: 收获量y(kghm2) 降雨量x1(mm) 温度x2() 2 250 3 450 4 500 6 750 7 200 7 500 8 250 25 33 45 105 110 115 120 6 8 10 13 14 16 17 要求: (1)试确定早稻收获量对春季降雨量和春季温度的二元线性
12、回归方程。(2)解释回归系数的实际意义。(3)根据你的判断,模型中是否存在多重共线性?解:(1)回归方程为:(2)在温度不变的情况下,降雨量每增加1mm,收获量增加22.386kghm2,在降雨量不变的情况下,降雨量每增加1度,收获量增加327.672kghm2。(3)与的相关系数=0.965,存在多重共线性。12.612.712.812.9 下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)。企业编号 销售价格y 购进价格x1 销售费用x2 l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 l 238 l 266 l 200 1 193 1 106 1
13、303 1 313 1 144 1 286 l 084 l 120 1 156 1 083 1 263 1 246 966 894 440 664 791 852 804 905 77l 511 505 85l 659 490 696 223 257 387 310 339 283 302 214 304 326 339 235 276 390 316 要求: (1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系? (2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用? (3)用Excel进行回归,并检验模型的线性关系
14、是否显著(a0.05)。 (4)解释判定系数R2,所得结论与问题(2)中是否一致?(5)计算x1与x2之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:(1)y与x1的相关系数=0.309,y与x2之间的相关系数=0.0012。对相关性进行检验:相关性 销售价格购进价格销售费用销售价格Pearson 相关性10.3090.001显著性(双侧)0.2630.997N151515购进价格Pearson 相关性0.3091-.853(*)显著性(双侧)0.2630.000N151515销售费用Pearson 相关性0.001-.853(*)1显著性(双侧)0.
15、9970.000N151515*. 在 .01 水平(双侧)上显著相关。可以看到,两个相关系数的P值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2)意义不大。(3)回归统计Multiple R0.593684R Square0.35246Adjusted R Square0.244537标准误差69.75121观测值15方差分析dfSSMSFSignificance F回归分析231778.153915889.083.2658420.073722残差1258382.77944865.232总计1490160.9333Coefficients标准误差t StatP-value
16、Lower 95%Upper 95%下限 95.0%上限 95.0%Intercept375.6018339.4105621.106630.290145-363.911115.114-363.911115.114购进价格x10.5378410.210446742.5557110.02520.0793170.9963650.0793170.996365销售费用x21.4571940.667706592.1823860.0496810.0023862.9120010.0023862.912001从检验结果看,整个方程在5%下,不显著;而回归系数在5%下,均显著,说明回归方程没有多大意义,并且自变量
17、间存在线性相关关系。(4)从R2看,调整后的R2=24.4%,说明自变量对因变量影响不大,反映情况基本一致。(5)方程不显著,而回归系数显著,说明可能存在多重共线性。(6)存在多重共线性,模型不适宜采用线性模型。12.11 一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运输费用作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15个路程大致相同,而货物类型不同的运输费用数据。每件产品的运输费用y(元) 货物类型 x1 172 111 120 109 138 65 100 115 70 85 21 l。3 34 75 20 易碎
18、品 易碎品 易碎品 易碎品 易碎品 易碎品 易碎品 易碎品 非易碎品 非易碎品 非易碎品 非易碎品 非易碎品 非易碎品 非易碎品 1 1 1 l 1 l 1 1 0 0 0 0 0 0 0 要求: (1)写出运输费用与货物类型之间的线性方程。 (2)对模型中的回归系数进行解释。(3)检验模型的线性关系是否显著(a0.05)。解:dfSSMSFSignificance F回归分析1187.2519187.251920.22290.000601残差13120.37219.259396总计14307.624Coefficients标准误差t StatP-valueLower 95%Upper 95%
19、下限 95.0%上限 95.0%Intercept4.5428571.1501183.9499060.0016622.0581797.0275352.0581797.027535x17.0821431.5748644.4969880.0006013.67985710.484433.67985710.48443(1)回归方程为:(2)非易碎品的平均运费为4.54元,易碎品的平均运费为11.62元,易碎品与非易碎品的平均运费差为7.08元。(3)回归方程的显著性检验:假设:H0:=0 H1:不等于0SSR=187.25195,SSE=120.3721,F=20.22P=0.000601,认为线性关
20、系显著。或者,回归系数的显著性检验:假设:H0:=0 H1:0t=4.5P=0.000601,认为y与x线性关系显著。12.12 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关数据如下:月薪y(元)工龄x1性别(1=男,0女)x2l 548l 6291 011l 229l 7461 528l 0181 190l 551985l 6101 4321 2159901 585323827343641383433323529332835ll00l100l0ll00l要求:用Excel进行回归,并对结果进行分析。解:回归统计Multiple R0.943391R Square0.8
21、89987Adjusted R Square0.871652标准误差96.79158观测值15方差分析dfSSMSFSignificance F回归分析2909488.4454744.248.539141.77E-06残差12112423.39368.61总计141021912Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept732.0606235.58443.1074250.009064218.76641245.355218.76641245.355工龄x1111.220272.083421.542
22、9370.148796-45.8361268.2765-45.8361268.2765性别(1=男,0女)x2458.684153.45858.580191.82E-06342.208575.1601342.208575.1601拟合优度良好,方程线性显著,工龄线性不显著,性别线性显著。第13章 时间序列分析和预测13.1 下表是1981年1999年国家财政用于农业的支出额数据 年份 支出额(亿元) 年份 支出额(亿元) 1981 110.21 1991 347.57 1982 120.49 1992 376.02 1983 132.87 1993 440.45 1984 141.29 199
23、4 532.98 1985 153.62 1995 574.93 1986 184.2 1996 700.43 1987 195.72 1997 766.39 1988 214.07 1998 1154.76 1989 265.94 1999 1085.76 1990 307.84 (1)绘制时间序列图描述其形态。(2)计算年平均增长率。(3)根据年平均增长率预测2000年的支出额。详细答案: (1)时间序列图如下: 从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。(2)年平均增长率为:。(3) 。 13.2 下表是1981年2000年我国油彩油菜籽单位面积产量数据(单位:
24、kg / hm2) 年份 单位面积产量 年份 单位面积产量 1981 1451 1991 1215 1982 1372 1992 1281 1983 1168 1993 1309 1984 1232 1994 1296 1985 1245 1995 1416 1986 1200 1996 1367 1987 1260 1997 1479 1988 1020 1998 1272 1989 1095 1999 1469 1990 1260 2000 1519 (1)绘制时间序列图描述其形态。(2)用5期移动平均法预测2001年的单位面积产量。(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.
25、5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?详细答案: (1)时间序列图如下: (2)2001年的预测值为:|(3)由Excel输出的指数平滑预测值如下表:年份 单位面积产量 指数平滑预测 a=0.3误差平方 指数平滑预测 a=0.5误差平方 19811451198213721451.06241.01451.06241.0198311681427.367236.51411.559292.3198412321349.513808.61289.83335.1198512451314.34796.51260.9252.0198612001293.58738.5125
26、2.92802.4198712601265.429.51226.51124.3198810201263.859441.01243.249833.6198910951190.79151.51131.61340.8199012601162.09611.01113.321518.4199112151191.4558.11186.7803.5199212811198.56812.41200.86427.7199313091223.27357.61240.94635.8199412961249.02213.11275.0442.8199514161263.123387.71285.517035.9199
27、613671308.93369.91350.7264.4199714791326.423297.71358.914431.3199812721372.210031.01418.921589.8199914691342.116101.51345.515260.3200015191380.219272.11407.212491.7合计 291455.2 239123.02001年a=0.3时的预测值为:a=0.5时的预测值为:比较误差平方可知,a=0.5更合适。 13.3 下面是一家旅馆过去18个月的营业额数据 月份 营业额(万元) 月份 营业额(万元) 1 295 10 473 2 283 11 470 3 322 12 481 4 355 13