《2022年虚拟变量与logistic回归练习题 .pdf》由会员分享,可在线阅读,更多相关《2022年虚拟变量与logistic回归练习题 .pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学而不思则惘,思而不学则殆虚拟变量回归练习题1、请根据下表数据建立回归模型来分析食品支出与税后收入和性别的关系(1)请建立性别对食品支出影响的回归模型模型汇总b模型R R 方调整 R 方标准 估计的误差Durbin-Watson 1 .435a.189 .108 570.84045 1.582 a. 预测变量 : ( 常量 ), 性别。b. 因变量 : 食品支出Anovab模型平方和df 均方F Sig. 1 回归759530.083 1 759530.083 2.331 .158a残差3258588.167 10 325858.817 总计4018118.250 11 a. 预测变量 : (
2、 常量 ), 性别。b. 因变量 : 食品支出系数a模型非标准化系数标准系数t Sig. B 标准误差试用版1 ( 常量 ) 2170.500 521.104 4.165 .002 性别503.167 329.575 .435 1.527 .158 a. 因变量 : 食品支出通过上述模型统计分析,我们可以得到如下结论:得到的P=0.1580.05,所以接受原假设,所以性别对食品支出无显著差异。(2)请建立考虑了税后收入和性别两个自变量对食品支出影响的回归模型,并进行解释。模型汇总b模型R R 方调整 R 方标准 估计的误差Durbin-Watson 1 .964a.928 .913 178.7
3、6928 1.926 a. 预测变量 : ( 常量 ), 性别 , 税后收入。b. 因变量 : 食品支出v 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 8 页学而不思则惘,思而不学则殆Anovab模型平方和df 均方F Sig. 1 回归3730492.144 2 1865246.072 58.365 .000a残差287626.106 9 31958.456 总计4018118.250 11 a. 预测变量 : ( 常量 ), 性别 , 税后收入。b. 因变量 : 食品支出系数a模型非标准化系数标准系数t Sig. B 标准 误差
4、试用版1 ( 常量 ) 1048.271 200.448 5.230 .001 税后收入.059 .006 .892 9.642 .000 性别228.987 107.058 .198 2.139 .061 a. 因变量 : 食品支出通过上述统计分析我们可以得到如下结论:在同时考虑税后收入和性别对食品支出的影响时,税后收入P=00.05,接受原假设,所以性别对食品支出无显著影响。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 8 页学而不思则惘,思而不学则殆2、考察 1990 年前后的中国居民的总储蓄-收入关系是否已发生变化。下表中给出
5、了中国 197920XX 年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。(1) 不考虑时间变量的影响建立回归模型。模型汇总模型R R 方调整 R 方标准 估计的误差1 .986a.972 .970 5413.22314 a.预测变量 : ( 常量 ), 储蓄。b.Anovaa模型平方和df 均方F Sig. 1 回归21027897021.581 1 21027897021.581 717.603 .000b残差615362679.617 21 29302984.744 总计21643259701.198 22 a. 因变量 : GNP b. 预测变量 : (常量 ),
6、储蓄。系数a模型非标准化系数标准系数t Sig. B 标准 误差试用版1 (常量 ) 8814.745 1467.565 6.006 .000 储蓄1.286 .048 .986 26.788 .000 a. 因变量 : GNP 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 8 页学而不思则惘,思而不学则殆通过上述建立的回归模型统计分析,我们可以得到:F分布值 P=00.05,所以拒绝原假设,所以说明储蓄和收入之间关系没有发生变化。(2) 引进时间变量,建立回归模型模型汇总b模型R R 方调整 R 方标准 估计的误差1 .993a.9
7、86 .984 3921.19231 a. 预测变量 : (常量 ), 是否 90, 储蓄。b. 因变量 : GNP Anovaa模型平方和df 均方F Sig. 1 回归21335744718.151 2 10667872359.076 693.812 .000b残差307514983.047 20 15375749.152 总计21643259701.198 22 a. 因变量 : GNP b. 预测变量 : (常量 ), 是否 90, 储蓄。系数a模型非标准化系数标准系数t Sig. B 标准 误差试用版1 (常量 ) 6991.461 1138.483 6.141 .000 储蓄1.0
8、99 .054 .843 20.232 .000 是否 90 11442.578 2557.255 .186 4.475 .000 a. 因变量 : GNP 残差统计量a极小值极大值均值标准 偏差N 预测值7300.2998 99504.0703 33939.9913 31141.71765 23 残差-6780.76807 6459.91992 .00000 3738.71018 23 标准 预测值-.855 2.105 .000 1.000 23 标准 残差-1.729 1.647 .000 .953 23 a. 因变量 : GNP 通过上述建立的回归模型统计分析,我们可以得到:F分布值
9、P=0 0.05 , 说明模型能够很好的拟合整体,不存在显著的差异。(2) 各自变量的显著性情况。不在方程中的变量得分df Sig. 步骤 0 变量X1 6.038 1 .014 X2 2.946 1 .086 X3(1) 5.073 1 .024 总统计量10.414 3 .015 模型系数的综合检验卡方df Sig. 步骤 1 步骤12.703 3 .005 块12.703 3 .005 模型12.703 3 .005 分类表a已观测已预测上下班方式百分比校正主要骑自行车主要乘坐公交汽车步骤 1 上下班方式主要骑自行车13 2 86.7 主要乘坐公交汽车3 10 76.9 总计百分比82.
10、1 a. 切割值为 .500 通过上述模型分析我们可以得到:X1(年龄) P=0.0140.05,所以接受原假设,则月收入与上下班关系不具有显著性。X3(性别) P=0.0240.05,所以拒绝原假设,则年龄与上下班关系具有显著性。方程中的变量B S.E, Wals df Sig. Exp (B) 步骤 0 常量-.143 .379 .143 1 .706 .867 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 8 页学而不思则惘,思而不学则殆(3) 自变量中有显著性的变量对因变量的影响程度,即优势比的意义。方程中的变量B S.E,
11、Wals df Sig. Exp (B) EXP(B) 的 95% C.I. 下限上限步骤 1aX1 .082 .052 2.486 1 .115 1.086 .980 1.202 X2 .002 .002 .661 1 .416 1.002 .998 1.005 X3(1) 2.502 1.158 4.669 1 .031 12.205 1.262 118.052 常量-6.157 2.687 5.251 1 .022 .002 a. 在步骤 1 中输入的变量 : X1, X2, X3. 通过上述 Logistic 回归模型分析,对上下班有显著性影响的是X1(年龄)和X3(性别),从方程中的变量这个表格我们可以很清晰的得到:X3(性别)相比X1(年龄)更具有显著性影响。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 8 页