《《应用回归分析》课后习题部分答案-何晓群版.doc》由会员分享,可在线阅读,更多相关《《应用回归分析》课后习题部分答案-何晓群版.doc(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 一元线性回归 2.14 解答:(1)散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 =(4) = (5)由于服从自由度为n-2的t分布。因而也即:=可得即为:(2.49,11.5) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数(7)ANOVAx平方和df均方F显著性组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对
2、自变量x的一元线性回归成立。(9)相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10) 序号111064221013-33320200442027-75540346残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)当广告费=4.2万元时,销售收入,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x与y之间大致呈线性关系。(3)设回归方程为 =(4) =0.23050.4801(5) 由于服从自由度为n-2的t分布。因而也即:=可得即为:(0.0028,0.0044) 服从自由度为n-2的t分布。因而即可得(6)x与y
3、的决定系数 =0.908(7) ANOVAx平方和df均方F显著性组间(组合).5007.2145.302.168线性项加权的.0361.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数.0009由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9) 相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10)序号1825353.07680.4232221510.88080.11923107043.95880
4、.0412455022.0868-0.0868548011.8348-0.8348692033.4188-0.4188713504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)(12),即为(2.7,4.7)近似置信区间为:,即(2.74,4.66)(13)可得置信水平为为,即为(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述y与x之间的关系.(2)回归方程为:(3) 从图上可看出,检验误差项服从正态分布。第三
5、章 多元线性回归3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson 相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.5471.000 y.048.008.009x1.048.378.127x2.008.378.051x3.009.127.051.Ny10101010x110101010x210101010x310101010所以=系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容
6、差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y (2) 所以三元线性回归方程为模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1
7、.898a.806.70823.44188.8068.28336.015a. 预测变量: (常量), x3, x1, x2。(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2。b. 因变量: y因为F=8.283 P=0.0150.05所以认为回归方程在整体上拟合的好(5)系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量
8、B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。去除x3后作F
9、检验,得:Anovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量: (常量), x2, x1。b. 因变量: y由表知通过F检验继续做回归系数检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970.556.697.476.9871.01
10、3x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013a. 因变量: y此时,我们发现x1,x2的显著性大大提高。(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)(8)(9) 残差统计量a极小值极大值均值标准 偏差N预测值175.4748292.5545231.500038.9520610标准 预测值-1.4381.567.0001.00010预测值的标准误差10.46620.19114.5263.12710调整的预测值188.3515318.1067240.183
11、549.8391410残差-25.1975933.22549.0000019.1402210标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.1231.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。 距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中杠杆值.099.642.300.17310a. 因变量: y所以置信区间为(175.4748,292.554
12、5)(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。 在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。第四章 违背基本假设的情况4.9 解:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.831.442-1.882.065x.004.000.83911.030.000a. 因变量: y由SPSS计算得:=-0.831+0.004
13、x残差散点图为:(2)由残差散点图可知存在异方差性再用等级相关系数分析:相关系数xtSpearman 的 rhox相关系数1.000.318*Sig.(双侧).021N5353t相关系数.318*1.000Sig.(双侧).021.N5353*. 在置信度(双测)为 0.05 时,相关性是显著的。P=0.021 所以方差与自变量的相关性是显著的。(3)模型描述因变量y自变量1x权重源x幂值1.500模型: MOD_1.M=1.5时可以建立最优权函数,此时得到:ANOVA平方和df均方FSig.回归.0061.00698.604.000残差.00351.000总计.00952系数未标准化系数标准
14、化系数tSig.B标准误试用版标准误(常数)-.683.298-2.296.026x.004.000.812.0829.930.000所以:-0.683+0.004x(4)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).582.1304.481.000x.001.000.8059.699.000a. 因变量: yy4.13 解:(1)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-1.435.242-5.930.000x.176.002.999107.928.000a. 因变量: y=-1.435+0.176x(2) 模型汇总b模型RR 方调整 R
15、方标准 估计的误差Durbin-Watson1.999a.998.998.09744.663a. 预测变量: (常量), x。b. 因变量: yDW=0.663 查DW分布表知:=0.95所以DW,故误差项存在正相关。残差图为:随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。(3)=1-0.5*DW=0.6685 计算得:Y x7.3944.907.6545.806.8440.698.0048.507.7946.858.2649.457.9648.478.2850.047.9048.038.4951.177.8847.268.7752.338.9352.699.3254.959.2
16、955.549.4856.779.3855.839.6758.009.9059.22模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.996a.993.993.073951.344a. 预测变量: (常量), xx。b. 因变量: yy系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.303.180-1.684.110xx.173.004.99649.011.000a. 因变量: yy得回归方程 =-0.303+0.173x即:=-0.303+0.6685+0.173(0.6685)(4)模型汇总b模型RR 方调整 R 方标准 估计的误差Du
17、rbin-Watson1.978a.957.955.074491.480a. 预测变量: (常量), x3。b. 因变量: y3系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).033.0261.273.220x3.161.008.97819.528.000a. 因变量: y3=0.033+0.161即:=0.033+0.161(-)(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。4.14解:(1)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.541a.293.264329.69302.7
18、45a. 预测变量: (常量), x2, x1。b. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-574.062349.271-1.644.107x1191.09873.309.3452.607.012x22.045.911.2972.246.029a. 因变量: y回归方程为:=-574.062+191.098x1+2.045x2DW=0.745Dl 所以误差项存在正相关残差图为:(2)=1-0.5*DW=0.6275模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.688a.474.452257.670641.716a.
19、预测变量: (常量), x22, x12。b. 因变量: y2系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-179.66890.337-1.989.052x12211.77047.778.5224.432.000x221.434.628.2692.283.027a. 因变量: y2此时得方程:=-179.668+211.77x1+1.434x2所以回归方程为:(3)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.715a.511.490283.791022.042a. 预测变量: (常量), x23, x13。b. 因变量: y3系数a模
20、型非标准化系数标准系数tSig.B标准 误差试用版1(常量)7.69839.754.194.847x13209.89144.143.5444.755.000x231.399.583.2742.400.020a. 因变量: y3此时得方程:所以回归方程为:第五章 自变量选择与逐步回归5.9 后退法:输出结果系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1438.1202252.472.638.533农业x1-.626.168-1.098-3.720.002工业x2-.328.207-1.352-1.587.135建筑业x3-.383.555-.251-.691.501人口x
21、4-.004.025-.014-.161.875最终消费x5.672.1303.7105.178.000受灾面积x6-.006.008-.015-.695.4992(常量)1079.754299.7593.602.003农业x1-.642.130-1.126-4.925.000工业x2-.303.131-1.249-2.314.035建筑业x3-.402.525-.263-.765.456最终消费x5.658.0953.6366.905.000受灾面积x6-.006.007-.017-.849.4093(常量)1083.150295.8163.662.002农业x1-.624.127-1.09
22、5-4.931.000工业x2-.373.093-1.535-3.998.001最终消费x5.657.0943.6276.981.000受灾面积x6-.005.007-.015-.758.4604(常量)874.604106.8698.184.000农业x1-.611.124-1.073-4.936.000工业x2-.353.088-1.454-3.994.001最终消费x5.637.0893.5167.142.000a. 因变量: 财政收入yAnovae模型平方和df均方FSig.1回归1.365E862.274E7602.127.000a残差.3191437770.951总计1.370E8
23、202回归1.365E852.729E7772.734.000b残差.8521535317.857总计1.370E8203回归1.364E843.411E7991.468.000c残差.1031634402.506总计1.370E8204回归1.364E834.547E71355.753.000d残差.9311733540.055总计1.370E820a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积
24、x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。e. 因变量: 财政收入y模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.998a.996.994194.34750.996602.127614.0002.998b.996.995187.93046.000.026114.8753.998c.996.995185.47913.000.585115.4564.998d.996.995183.13944.000.574116.460a. 预测变量: (常量), 受灾面积x6,
25、 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。回归方程为: 逐步回归法:输出结果模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.994a.989.988285.68373.9891659.441119.0002.996b.992.991247.77768.0037.2
26、58118.0153.998c.996.995183.13944.00415.948117.001a. 预测变量: (常量), 最终消费x5。b. 预测变量: (常量), 最终消费x5, 农业x1。c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。Anovad模型平方和df均方FSig.1回归1.354E811.354E81659.441.000a残差.6541981615.192总计1.370E8202回归1.359E826.794E71106.637.000b残差.0031861393.778总计1.370E8203回归1.364E834.547E71355.753.00
27、0c残差.9311733540.055总计1.370E820a. 预测变量: (常量), 最终消费x5。b. 预测变量: (常量), 最终消费x5, 农业x1。c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。d. 因变量: 财政收入y系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)710.37290.8917.816.000最终消费x5.180.004.99440.736.000.994.994.9942(常量)1011.912136.9017.392.000最终消费x5.311.0491.7186.374.000.994.832.135
28、农业x1-.414.154-.726-2.694.015.987-.536-.0573(常量)874.604106.8698.184.000最终消费x5.637.0893.5167.142.000.994.866.112农业x1-.611.124-1.073-4.936.000.987-.767-.077工业x2-.353.088-1.454-3.994.001.992-.696-.062a. 因变量: 财政收入y回归方程为:5.10(1)模型汇总模型RR 方调整 R 方标准 估计的误差1.908a.824.736625.883262.000b.000.0001217.15945a. 预测变量
29、: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量)Anovac模型平方和df均方FSig.1回归1.830E75.6839.346.002a残差.52210.852总计2.222E7152回归.0000.000.b残差2.222E715.129总计2.222E715a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量)c. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)5922.8272504.3152.365.040x24.8642.507.6771.940.081x32.374.842.
30、7822.818.018x4-817.901187.279-1.156-4.367.001x514.539147.078.050.099.923x6-846.867291.634-.899-2.904.0162(常量)7542.938304.29024.789.000a. 因变量: y回归方程为:(2)后退法:输出结果模型汇总模型RR 方调整 R 方标准 估计的误差1.908a.824.736625.883262.907b.824.759597.04776a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。Anovac
31、模型平方和df均方FSig.1回归1.830E75.6839.346.002a残差.52210.852总计2.222E7152回归1.830E74.66912.835.000b残差.26211.024总计2.222E715a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。c. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)5922.8272504.3152.365.040x24.8642.507.6771.940.081x32.374.842.7822.818.018x4-817.9
32、01187.279-1.156-4.367.001x514.539147.078.050.099.923x6-846.867291.634-.899-2.904.0162(常量)6007.3202245.4812.675.022x25.0681.360.7063.727.003x32.308.486.7604.750.001x4-824.261167.776-1.165-4.913.000x6-862.699232.489-.916-3.711.003a. 因变量: y(3)逐步回归模型汇总模型RR 方调整 R 方标准 估计的误差1.498a.248.1941092.832062.697b.4
33、85.406937.950383.811c.657.572796.60909a. 预测变量: (常量), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量), x3, x5, x4。Anovad模型平方和df均方FSig.1回归.0901.0904.607.050a残差1.672E714.918总计2.222E7152回归1.079E72.5546.130.013b残差1.144E713.910总计2.222E7153回归1.461E73.5067.673.004c残差.41812.035总计2.222E715a. 预测变量: (常量), x3。b. 预测变量: (常
34、量), x3, x5。c. 预测变量: (常量), x3, x5, x4。d. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)5161.2591142.7444.517.000x31.511.704.4982.146.0502(常量)472.2982150.138.220.830x33.188.9131.0503.492.004x5212.32586.643.7372.451.0293(常量)1412.8071865.912.757.464x33.440.7821.1334.398.001x5348.72992.2201.2103.782.003x4-415.136169.163-.587-2.454.030a. 因变量: y(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力第六章 多重共线性的情形及其处理6.6解:由下表我们可以看出系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差