《2022年虚拟变量与logistic回归练习题.docx》由会员分享,可在线阅读,更多相关《2022年虚拟变量与logistic回归练习题.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆虚拟变量回来练习题1、请依据下表数据建立回来模型来分析食品支出与税后收入和性别的关系(1)请建立性别对食品支出影响的回来模型模型R R 方模型汇总b标准 估量的误差Durbin-Watson 调整 R 方1 .435a.189 .108 570.84045 1.582 a. 猜测变量 : 常量 , 性别;b. 因变量 : 食品支出b Anova模型平方和df 1 均方F Sig. a1 回来759530.083 759530.083 2.331 .158残差3258588.167 10 325858.817 总计401
2、8118.250 11 a. 猜测变量 : 常量 , 性别;b. 因变量 : 食品支出模型 常量 系数a标准系数t Sig. 非标准化系数B 标准误差试用版1 2170.500 521.104 .435 4.165 .002 性别503.167 329.575 1.527 .158 a. 因变量 : 食品支出通过上述模型统计分析,我们可以得到如下结论:得到的 P=0.1580.05,所 以接受原假设,所以性别对食品支出无显著差异;(2)请建立考虑了税后收入和性别两个自变量对食品支出影响的回来模型,并 进行说明;模型R 模型汇总b标准 估量的误差Durbin-Watson R 方调整 R 方1
3、.964a.928 .913 178.76928 1.926 a. 猜测变量 : 常量 , 性别 , 税后收入;b. 因变量 : 食品支出v 名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆Anovab模型平方和df 2 均方F Sig. a1 回来3730492.144 1865246.072 58.365 .000残差287626.106 9 31958.456 总计4018118.250 11 a. 猜测变量 : 常量 , 性别 , 税后收入;b. 因变量 : 食品支出系数a模型 常量 非标准化系数
4、标准系数t Sig. B 标准 误差试用版1 1048.271 200.448 .892 5.230 .001 税后收入.059 .006 9.642 .000 性别228.987 107.058 .198 2.139 .061 a. 因变量 : 食品支出通过上述统计分析我们可以得到如下结论:在同时考虑税后收入和性别对食品支出的影响时,税后收入 P=00.05,接受原假设,所以性别对食品支出无显著影响;名师归纳总结 - - - - - - -第 2 页,共 8 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆2、考察 1990 年前后的中国居民的总储蓄-收入关系是
5、否已发生变化;下表中给出了中国 197920XX 年以城乡储蓄存款余额代表的居民储蓄以及以 GNP 代表的居民收入的数据;1 不考虑时间变量的影响建立回来模型;模型汇总模型R R 方调整 R 方标准 估量的误差1 .986a.972 .970 5413.22314 a.猜测变量 : 常量 , 储蓄;b.模型回来平方和Anovaa均方F Sig. bdf 1 21027897021.581 21027897021.58717.603 .0001 1 残差21 615362679.617 29302984.744 总计21643259701.1922 8 a. 因变量 : GNP b. 猜测变量
6、: 常量 , 储蓄;标准系数t Sig. 模型系数a非标准化系数1 常量 储蓄B 标准 误差试用版6.006 .000 8814.745 1467.565 1.286 .048 .986 26.788 .000 a. 因变量 : GNP 名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆通过上述建立的回来模型统计分析,我们可以得到:F分布值 P=00.05,所以拒绝原假设,所以说明储蓄和收入之间关系没有发生变化;2 引进时间变量,建立回来模型模型R 模型汇总b标准 估量的误R 方调整 R 方差1 .993a
7、.986 .984 3921.19231 a. 猜测变量 : 常量 , 是否 90, 储蓄;b. 因变量 : GNP 模型回来平方和Anovaa均方F Sig. bdf 1 21335744718.152 10667872359.07693.812 .0001 6 残差20 307514983.047 15375749.152 总计21643259701.1922 8 a. 因变量 : GNP b. 猜测变量 : 常量 , 是否 90, 储蓄;标准系数t Sig. 系数a模型非标准化系数B 标准 误差试用版6.141 .000 常量 6991.461 1138.483 1 储蓄1.099 .0
8、54 .843 20.232 .000 是否 90 11442.578 2557.255 .186 4.475 .000 a. 因变量 : GNP 猜测值微小值残差统计量a标准 偏差N 23 极大值均值7300.2998 99504.0703 33939.9913 31141.71765 残差-6780.76807 6459.91992 .00000 3738.71018 23 标准 猜测值-.855 2.105 .000 1.000 23 标准 残差-1.729 1.647 .000 .953 23 a. 因变量 : GNP 通过上述建立的回来模型统计分析,我们可以得到:F分布值 P=0 0
9、.05 , 说明模型能够很好的拟合整体,不存在显著的差异;(2) 各自变量的显著性情形;方程中的变量步骤 0 常量B S.E, Wals df 1 Sig. Exp B -.143 .379 .143 .706 .867 不在方程中的变量步骤 0 变量X1 得分df 1 Sig. 6.038 .014 X2 2.946 1 .086 总统计量X31 5.073 1 .024 10.414 3 .015 模型系数的综合检验步骤 1 步骤卡方df 3 Sig. 12.703 .005 块12.703 3 .005 模型12.703 3 .005 分类表a已观测已猜测百分比校正上下班方式主要骑自行车
10、主要乘坐公交汽车步骤 1 上下班方式主要骑自行车13 2 86.7 主要乘坐公交汽车3 10 76.9 总计百分比82.1 a. 切割值为 .500 通过上述模型分析我们可以得到:X1(年龄) P=0.0140.05,所以接受原假设,就月收入与上下班关系不具有显 著性;X3(性别) P=0.0240.05,所以拒绝原假设,就年龄与上下班关系具有显著性;名师归纳总结 - - - - - - -第 7 页,共 8 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆(3) 自变量中有显著性的变量对因变量的影响程度,即优势比的意义;方程中的变量步骤 1aX1 B S.E,
11、Wals df 1 Sig. Exp B EXPB 的 95% C.I. .082 .052 2.486 .115 1.086 下限上限.980 1.202 X2 .002 .002 .661 1 .416 1.002 .998 1.005 X31 2.502 1.158 4.669 1 .031 12.205 1.262 118.052 常量-6.157 2.687 5.251 1 .022 .002 a. 在步骤 1 中输入的变量 : X1, X2, X3. 通过上述 Logistic回来模型分析,对上下班有显著性影响的是 X1(年龄)和X3(性别),从方程中的变量这个表格我们可以很清楚的得到:X3(性别)相比X1(年龄)更具有显著性影响;名师归纳总结 - - - - - - -第 8 页,共 8 页