《回归分析--实验报告(共6页).doc》由会员分享,可在线阅读,更多相关《回归分析--实验报告(共6页).doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上城镇居民家庭收入的逐步回归分析07级 数学1班 盛平 摘要 :用多元统计中逐步回归分析的方法和SAS软件解决了可支配收入与其他收入之间的关系,并用此模型预测在以后几年里居民平均每人全年家庭可支配收入。关键词:逐步回归分析 多元统计 SAS软件正文1 模型分析各地区城镇居民平均每人全年家庭可支配收入y与工薪收入x1、经营净收入x2、财产性收入x3和转移性收入x4有关,共观测了15组数据,试用逐步回归法求最优回归方程。各地区城镇居民平均每人全年家庭收入来源 (2007年) 单位:元地 区可支配收入 Y工薪收入 X1经营净收入 X2财产收入 X3转移性收入X4北 京2198
2、8.7117318.72298.48530.836427.54天 津16357.3510882.24800.82233.015912.08 河 北11690.478325.67649.79163.773196.73山 西11564.959057.81431.07187.462792.06内蒙古12377.849300.621036.97303.922335.56辽 宁12300.398213.06765.33263.734196.30吉 林11285.527641.21741.51131.803284.07黑龙江10245.286945.95919.6798.262918.34上 海23622
3、.7318996.581157.55368.795578.63江 苏16378.0110791.221502.06402.854990.35浙 江20573.8214509.69 2611.911080.284381.95安 徽11473.588683.96688.34249.782877.25福 建15506.0511175.251208.84739.893859.28江 西11451.698411.73655.34155.542761.39山 东14264.7011814.19730.16304.712517.21 2模型的理论(1)基本思想: 逐个引入自变量,每次引入对y影响最显著的自变
4、量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中既不漏掉对Y影响显著的变量,又不包含对Y影响不显著的变量。(2)逐步筛选的步骤:首先给出引入变量的显著性水平和剔除变量的显著性水平;然后按图4.1的框图筛选变量。3模型的求解(1)源程序:data ch;input x1 x2 x3 x4 x5 y ;cards; 28.2 47.9 44.1 3.8 23.9 100.0 31.3 47.1 43.6 3.5 21.6 100.0 30.2 48.2 43.9 4.3 21.6 100.0 31.9 46.1 41.9 4.2 22.0 100.0 33
5、.4 44.8 40.6 4.1 21.8 100.0 33.2 44.4 39.9 4.5 22.4 100.0 32.1 43.1 38.7 4.4 24.8 100.0 28.4 42.9 38.3 4.6 28.7 100.0 27.2 43.7 38.6 5.1 29.1 100.0 26.8 43.6 38.0 5.5 29.6 100.0 25.7 43.8 38.4 5.4 30.5 100.0 25.1 42.8 38.2 4.7 32.1 100.0 27.1 41.3 36.7 4.6 31.6 100.0 24.5 41.8 37.1 4.7 33.7 100.0 21
6、.8 43.4 38.2 5.3 34.8 100.0 19.7 46.6 40.2 6.4 33.7 100.0 19.8 46.6 40.4 6.2 33.6 100.0 19.9 47.2 41.0 6.1 32.9 100.0 19.7 47.5 41.4 6.2 32.8 100.0 18.3 47.5 41.7 5.9 34.2 100.0 17.6 46.2 40.3 5.9 36.2 100.0 16.5 45.8 40.0 5.8 37.7 100.0 15.1 45.9 40.4 5.6 39.0 100.0 14.4 45.1 39.7 5.4 40.5 100.0 13
7、.7 44.8 39.4 5.4 41.5 100.0 12.8 46.0 40.5 5.5 41.2 100.0 13.4 46.2 40.8 5.4 40.4 100.0 12.2 47.7 42.2 5.5 40.1 100.0 11.3 48.7 43.1 5.6 40.0 100.0 11.3 48.6 43.0 5.6 40.1 100.0 ; proc reg; model Y=X1-X5; model Y=X1-X5/selection=stepwise; run;(2)输出的结果:(3)结果的分析可以看出该模型明显优于第一步和第二步得到的回归模型,因为R平方接近于1,且C(P)统计量有了显著的下降。此时得到的回归模型是:Y=653.89241+0.8982X1+1.24728X2+0.82709X4由模型的参数估计及相应的P值可以得到,X1,X2,X4这 三个变量对Y的影响是显著的。参考文献:【1】 国家统计局 中国统计年鉴-2007【M】中国统计出版社 2007【2】 高惠璇 应用多元统计分析【M】北京大学出版社 2005.01专心-专注-专业