《回归分析练习试题和参考答案解析.docx》由会员分享,可在线阅读,更多相关《回归分析练习试题和参考答案解析.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1下面是7个地区2000年的人均国生产总值GDP和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元224607326112264490345471154648512396544422082662160845492035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系 形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a =0.05 )。(6)如果某地区的人均GDP为5000元,预测其人均消费水平。(7)求人
2、均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:12000-10000-8000-人均消费水平6000-4000-人均GDP14)T口天办女乂 -显著性双侧显著性双侧0.9970.000151515*.在.01水平双侧上显著相关。可以看到,两个相关系数的P值都比较的,总体上线性关系也不现状,因此没有明显 的线性相关关系。2意义不大。3回归统计Multiple R R Square Adjusted Square标准误差 观测值0.5936840.35246R 0.24453769.7512115方差分析Significance dfSSMSFF回归分析231778.1539
3、15889.083.2658420.073722残差1258382.7794 4865.232总计1490160.9333CoefficienLower Upper 下限上 P艮 ts标准误差 t Stat P-value 95%95%95.0%95.0%339.41050.29014(常量)375.6018621.106635 -363.91 1115.114-363.91 1115.114购进价格x10.537841741 0.0252 0.079317 0.996365 0.079317 0.996365销 售费用0.6677062.182380.04968x21.4571945961
4、0.002386 2.912001 0.002386 2.912001从检验结果看,整个方程在5%下,不显著;而回归系数在5%下,均显著,说明回归方程 没有多大意义,并且自变量间存在线性相关关系。4从R2看,调整后的R2=24.4%,说明自变量对因变量影响不大,反映情况根本一 致。5方程不显著,而回归系数显著,说明可能存在多重共线性。6存在多重共线性,模型不适宜采用线性模型。6 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用 对月销售额作出估计。下面是近8个月的销售额与广告费用数据:月销售收入y/万元电视广告费用/万元报纸广告费用X2/万元965.01.5902
5、.02.0954.01.5922.52.5953.03.3943.52.3942.54.2943.02.5求:(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方 程。(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否一样?对其回归系数分别 进展解释。(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释 的比例是多少?(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(a = 0.05 )。解:1回归方程为:88.64+1.6%2回归方程为83.23
6、 + 2.29x + 1.3%123不一样,1中说明电视广告费用增加1万元,月销售额增加1.6万元;2 中说明,在报纸广告费用不变的情况下,电视广告费用增加1万元,月销售额增加2.29万元。4判定系数R2= 0.919,调整的/?2= 0.8866,比例为88.66%。a5回归系数的显著性检验:Coefficie 标准误P-valuLowerUpper下限上限nts 差 t State 95%95%95.0%95.0%83.2300 1.5738 52.882 4.57E- 79.1843 87.2758Intercept969480835 79.18433 87.27585电视广告费用工:x
7、1 2.29018 0.3040 7.5318 0.0006 1.50856 3.07180(万元)465995316 1.508561 3.071806报纸广告费用 x2(万 1,30098 0.32074.05660.0097 0.47659 2.12537元)902976199 0.476599 2.125379假设:H : p =o H : P 0o 1112.29 =7 53 0.304 .t (5)=2.57 t t (5),认为y与线性关系显著。0.02510.025713回归系数的显著性检验:假设:% P2=o H1:91.3= o32=t (5),认为y与x线性关系显著。J
8、VZ vz7某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下:收获量y(kg/hmz)降雨量xjmm)温度X2()2250256345033845004510675010513720011014750011516825012017求:(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。(2)解释回归系数的实际意义。(3)根据你的判断,模型中是否存在多重共线性?解:1回归方程为:y = -0.591 + 22.386x + 327.672x122在温度不变的情况下,降雨量每增加1mm,收获量增力口 22386kg/hmz,在降雨 量不变的情况下,降雨量每增加1度,收获量增
9、加327.672kg/hm2。3x与x的相关系数r=0.965,存在多重共线性。125系数a模型非标准化系数标准系数tSig.相关性R标准误差试用版零阶偏局部1(常量)人均GDP734.693,309139.540.008.9985.26536.492.003,000,998.998,998a.因变量:人均消费水平有很强的线性关系。3回归方程:y = 734.693 + 0.309%系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏局口61(常量)人均GDP734.693.309139.540.008.9985.26536,492.003.000.998.998.998a.因
10、变量:人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。 %注意:图标不要原封不动的完全复制软件中的图标,要按规排版。系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1常量734.693139.5405.2650.003人均GDP元0.3090.0080.99836.4920.000a.因变量:人均消费水平元%4模型汇总模型RR方调整R方标准估计的误差1.998a.996.996247.303a.预测变量:(常量),人均GDP。人均GDP对人均消费的影响到达99.6%。%注意:图标不要原封不动的完全复制软件中的图标,要按规排版。模型摘要模型RR方调整的R方
11、估计的标准差1.998(a)0.9960.996247.303a.预测变量:(常量),人均GDP元。%5F检验:Anovaba.预测变量:(常量),人均GDP。模型平方和dfFSig.1回归81444968.680181444968.6801331.692.000a歹叫305795.034561159.007总计81750763.7146b.因变量:人均消费水平回归系数的检验:t检验系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏局部1(常量)人均GDP734.693.309139.540.008.9985.26536.492.003.000.998.998.998a.因变
12、量:人均消费水平%注意:图标不要原封不动的完全复制软件中的图标,要按规排版。系数(a)非标准化系数标准化系数模型B 标准误 Betat 显著性1常量734.693139.5405.2650.003人均 GDP元0.3090.0080.99836.4920.000a.因变量:人均消费水平元%6某地区的人均GDP为5000元,预测其人均消费水平为y = 734.693 + 0.309 x 5000 = 2278.693 (元)。7人均GDP为5000元时,人均消费水平95%的置信区间为1990.74915,2565.46399,预 测区间为1580.46315,2975.74999。2从n=20的
13、样本中得到的有关回归结果是:SSR回归平方和=60,SSE误差平方和=40。要检验x与y之间的线性关系是否显著,即检验假设:H : P = 0。 01线性关系检验的统计量F值是多少? (2)给定显著性水平a = 0.05,F是多少?a(3)是拒绝原假设还是不拒绝原假设?(4)假定x与v之间是负相关,计算相关系数r。(5)检验x与y之间的线性关系是否显著?解:1 j SSR的自由度为k=1 ; SSE的自由度为n-k-1=18 ;5-15-1I60匚丽181 8) 5274105 O3拒绝原假设,线性关系显著。4r=SSR + SSE=,746,由于是负相关,因此=077465从F检验看线性关系
14、显著。3随机抽取7家超市,得到其广告费支出和销售额数据如下:超市广告费支出/万元销售额/万元AB CD EFG12 46 1014 2019324440525354求:用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著(a =0.05 )o(3)绘制关于x的残差图,你觉得关于误差项的假定被满足了吗? (4)你是选用这个模型,还是另寻找一个更好的模型?解:系数(a)非标准化系数标准化系数模型B 标准误 Betat 显著性1常量29.3994.8076.1160.002广告费支出万元1.5470.4630.8313.3390.021a.
15、因变量:销售额万元2回归直线的F检验:ANOVA(b)模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.000a.预测变量:(常量),广告费支出万元。b.因变量:销售额万元显著。回归系数的t检验:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1常量29.3994.8070.8316.1160.002广告费支出力兀J1.5470.4633.3390.021a.因变量:销售额万元显著。3未标准化残差图:10.000005. 00000lauGlseK dezlaradnatso0. 00000-5.
16、00000-10.00000-15.0000005101520广告费支出(万元)标准化残差图:1.00000lauulseR dezldradnaldlauulseR dezldradnald0. 00000-1.00000-2. 0000005IO1520广告费支出(万元)学生氏标准化残差图:2. 000001.00000lauQISOR dezltnuuts0. 00000OOO-1. 00000-2. 0000010广告费支出(万元)1520看到残差不全相等。4应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)4根据下面SPSS输出的回归结
17、果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F,Sr,R2及调整的R2的值对模型进展讨论o模型汇总b模型RR方调整R方标准估计的误差10.8424070.7096500.630463109.429596Anovab模型平方和dfFSig.1回归321946.80183107315.60068.9617590.002724残差131723.19821111974.84总计45367014系数a模型非标准化系数tSig.B标准误差1(常量)657.0534167.4595393.9236550.002378VAR000025.7103111.7918363.1868490.0
18、08655VAR00003-0.4169170.322193-1.2939980.222174VAR00004-3.4714811.442935-2.4058470.034870解:自变量3个,观察值15个。回归方程:=657.0534+5.710311X -0.416917X -3.471481X123拟合优度:判定系数R2=0.70965,调整的R2 =0.630463,说明三个自变量对因变量的影响a的比例I占至63%。估计的标准误差S =109.429596,说明随即变动程度为109.429596回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系
19、显著。回归系数的检验:P典t检验的P=0.008655,在显著性为5%的情况下,丫与天线性关系显 著。久的t检验的P=0.222174,在显著性为5%的情况下,y与X2线性关系不显著。P q的t检验的P=0.034870,在显著性为5%的情况下,y与X3线性关系显著。因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。5下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)。企业编号销售价格V购进价格x1销售费用x2123456789101112131415123812661200119311061303131311441286108411201156108312631246
20、966894440664791852804905771511505851659490696223257387310339283302214304326339235276390316(1)计算V与xy与X2之间的相关系数,是否有证据说明销售价格与购进价格、销售 价格与销售费用之间存在线性关系?(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?(3)求回归方程,并检验模型的线性关系是否显著(a =0.05 )o(4)解释判定系数R2,所得结论与问题(2)中是否一致?(5)计算x1与x2之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:1y与的相关系数=0.309,y与之间的相关系数=0.0012。对相关性进展检 验:相关性销售价格购进价格销售费用销售价格Pearson相关性10.3090.001显著性双侧0.2630.997N151515购进价格Pearson相关性0.3091-.853(*)显著性双侧0.2630.000N151515销售费用Pearson相关性0.001-.853(*)1