《多元线性回归分析城镇居民消费性支出的情况.doc》由会员分享,可在线阅读,更多相关《多元线性回归分析城镇居民消费性支出的情况.doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流多元线性回归分析城镇居民消费性支出的情况.精品文档.多元线性回归分析城镇居民消费性支出的情况信息与计算科学 2005级 陈 鹏 指导教师 曹正照 副教授摘要:本论文用多元回归的模型,回归方程的显著性检验以及回归系数的显著性检验的方法对城镇居民人均消费性支出与平均每人年可支配收入,食品支出,城镇居民人均住宅面积,就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的关系进行了研究。结果显示,平均每人年可支配收入,食品支出对城镇居民人均消费性支出有显著性影响,并预测2008年的城镇居民家庭消费性支出。关键词:多元回归分析,F检验,T检验,城镇居
2、民人均消费性支出Multiple linear regression analysis of consumption expenditure of urban residents of the situationChen Peng Information and Computational Science,Grade 2005Directed by Cao Zheng-zhao(Associate Prof)Abstract: In this paper, using multiple regression model, significant regression equation and
3、regression coefficient test of significance test of the method of urban residents and per capita consumption expenditure per capita disposable income of the year, food expenditure, per capita housing area of urban residents for employment collective units was paid staff, employed to obtain the state
4、-owned units for the relationship between the remuneration were studied. The results showed that the average annual disposable income, food expenditure per capita consumption of urban residents are spending significant impact And urban residents in 2008 household consumption expenditure to make a fo
5、recast aboutKeywords: Regression analysis,F test,T test,Of urban residents per capita consumption expenditure回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如
6、果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。本文利用线性回归分析的方法,从数量关系上来寻找城镇居民人均消费性支出、平均每人年可支配收入、食品支出、城镇居民人均住宅面积、就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的相关关系,研究家庭消费性支出主要受哪些因素的影响。城镇居民家庭可支配收入是指被调查的城镇居民家庭在支付个人所得税、财产税及其他经常性转移支出后所余下的实际收入。城镇居民家庭消费性支出是指被调查的城镇居民家庭用于日常生活的全部支出,包括购买商品支出和文化生活、服务等非商品性支出。随着人民生活水平的提高,收入增加,消费性的支出
7、也随之增加,在搜集了有关这方面的数据后,运用我学到的多元线性回归理论知识,分析尝试建立模型,着眼于消费需求,通过对城镇住户数据的深入分析,研究城镇居民的收入,消费现状,为政府部门了解民生提供可供参考的资料。1 多元线性回归的数学方法1.1 模型设因变量与个自变量之间有线性关系:(1)其中为随机变量且,称为随机误差1。称为多元线性回归的数学模型. 将n次观测数据代入上面的方程,可得:假定相互独立,且服从同一正态分布。则(2)可表示为: 1.2 回归系数的最小二乘估计假设由某种方法得到的估计值则的观测值可表示为,称为经验回归方程。这里是的估计值,仍称为残差或剩余。令为的估计值,即 类似于一元线性回
8、归,对进行最小二乘估计是要选取 , 使 达到最小。故得: 即得正规方程组从第一个方程中解出将代入后面p个方程化简得其中从中求出,再求出, 得经验回归方程1.3 回归方程的显著性检验(F检验)检验多元线性回归方程是否显著,就是检验与,中的某些自变量之间是否有较密切的线性关系。检验假设为:。如果被接受,则表明随机变量与,中的某些自变量之间的关系不显著,线性回归模型不合适。为回归平方和 为剩余平方和 为总平方和 =+当假设成立时,于是,可以利用F统计量对回归方程的总体显著性进行检验。对于给定到数据,计算出和,进而得到F的值,再由给定到显著性水平,查F分布表,得临界值。当时,则拒绝假设,认为在显著水平
9、下,y对有显著的线性关系,也即回归方程是显著的;反之,则认为回归方程不显著.1.4 回归系数的显著性检验(T检验)在多元线性回归中,回归方程显著并不意味着每个自变量对y的影响都显著。因此要想从回归方程中剔除那些次要的、可有可无的变量,重新建立更为简单有效的回归方程。所以我们就要检验对y的影响是否显著。显然,如果某个自变量的作用不显著,那么在回归模型中,它的系数就可以取值为零。因此,检验变量是否显著,等价于检验假设 ,如果接受假设,则自变量对因变量不显著;如果拒绝假设,则自变量对因变量是显著的。当假设成立时,统计量服从自由度(n-p-1)的t分布。若,则拒绝假设,认为是重要的,应保留在回归方程中
10、;若,则认为变量可以从回归方程中剔除。2 实例分析1978-2007年遵义市家庭消费性支出及其相关数据如下表(表一)年份y19782733251955.9251363519793053822196.6152263619803404012135.8354776319814294412576.5554975019824254612566.7059376419834644952766.9357977219845095792948.0269887619856416913368.07687103919867848643820.00827120019877909384168.488781292198810
11、4611015499.43968152419891138147566511.261012161219901437172566611.051166183919911755213177412.811360199219922078256095613.4216012330199331323331117412.6720542658199442284035137212.6723363664199533674203169612.6428883962199634724382193115.0227754539199735714530189916.0032654858199835394605188217.0038
12、415291199937524954199518.0042206091200039575214188819.5151286887200143835540188418.8454989053200246355863177825.86667710319200348406546194926.25910410832200453937526218926.83890713480200560988207231927.891261516264200664558943242828.0314566181732007776011340318931.10175482249221 模型的建立上表中y为城镇居民人均消费性支
13、出(元),为平均每人年可支配收入(元),为食品支出(元),为城镇居民人均住宅面积(平方米),为就业人员获得集体单位报酬(元),为就业人员获得国有单位报酬(元)。假设关于消费性支出的回归方程为。22 模型的求解根据SPSS软件运算结果显示,可得回归方程中的回归系数如下表(表二)Unstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound(Constant)292.965109.3592.6790.01367.25
14、9518.672x11.5230.1652.1209.2220.0001.1821.864x2-1.2510.327-0.502-3.8300.001-1.925-0.577x3-14.54814.653-0.055-0.9930.331-44.79115.694x4-0.1320.075-0.277-1.7570.092-0.2870.023x5-0.1250.070-0.339-1.7860.087-0.2690.019由上表数据结果显示,可以得到回归系数292.965,1.523,-1.251,-14.548,-0.132,-0.125,则关于的线性回归方程为根据SPSS13软件运行,可
15、得到结果如下表(表三)模型摘要ModelRR SquareAdjusted R SquareStd. Error of the Estimate10.9970.9940.993182.28489根据上表数据显示,可得到复相关系数R=0.997,可决定系数为=0.994,说明回归方程具有高度的显著性。另外,做方差分析,见下表(表四)方差分析Model Sum of SquaresdfMean SquareFSig.1Regression133,511,192.691526,702,238.538803.6120.000Residual797,466.7762433,227.782Total134
16、,308,659.46729选定=0.05,查2.62,803.6122.62,由此也可得出,方差分析也表明回归方程具有高度的显著性,说明整体上对有高度显著的影响。用SPSS软件作出各个自变量与因变量的关系点图,如下图一:已经选定=0.05,根据表二结果显示,的t值绝对值小于,则说明自变量对显著性影响不明显,同理可得,自变量对显著性影响明显,根据图一中的5个关系点图也可以得出上述结论。本例中t值最小的一个变量为,对应的t值为0.993.从定性分析看,城镇居民人均住宅面积对城镇居民人均消费性支出的影响应该是小的。为了简化模型,首先剔除t值最小的一个变量,即的t值最小,首先剔除它,用其余的4个自变
17、量作回归,计算结果如下表(表五)Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)206.34765.9223.130.004x11.4710.1572.0479.3950x2-1.2020.323-0.482-3.7240.001x4-0.1180.074-0.247-1.60.122x5-0.1350.069-0.367-1.9560.062剔除后,其余的自变量的显著性都发生了不同的变化。用SPSS软件作出各个因变量与因变量的关系点图,如下图二:图一和图二做对比,两个自变量对的
18、显著性进一步提高,而也出现了对具有显著性的趋势。但是根据表五,的t值绝对值小于仍然不显著,此时最小的t值为,因而进一步剔除。剔除后得出结果如下表(表六)Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)202.16067.8152.9810.006x11.4470.1602.0139.0160.000x2-1.1040.326-0.443-3.3840.002x5-0.2260.040-0.615-5.6460.000剔除后,用SPSS软件作出各个因变量与因变量的关系点图,如下图三
19、:图三与图二作比较,产生了对的显著性影响,且线性相关。同时由表六可以得出都大于,说明对因变量有显著性影响,回归系数通过了显著性检验。到此,可以得到最好的回归方程为。在本例中从不具有显著性转变到了具有显著性,这是由于自变量之间的相关性造成的。另外,根据表二可以得出的置信区间分别为(67.259,518.672),(1.182, 1.864),( -1.925, -0.577),( -44.791, 15.694),( -0.287, 0.023), (-0.269,0.019)。输出结果文件中残差统计结果表(表七)如下:Residuals Statistics(a) MinimumMaximum
20、MeanStd. DeviationNPredicted Value312.58907,943.65582,699.86672,144.3700130Std. Predicted Value-1.1132.4450.0001.00030Standard Error of Predicted Value43.081118.95867.23820.04130Adjusted Predicted Value316.69828,058.30422,696.50032,151.2277430Residual-521.48700586.985170.00000181.6875030Std. Residua
21、l-2.7183.0590.0000.94730Stud. Residual-3.1483.6350.0081.09130Deleted Residual-699.81439828.726323.36640242.4292130Stud. Deleted Residual-3.9255.0820.0341.35030Mahal. Distance0.49510.1792.9002.46030Cooks Distance0.0001.3600.0980.28830Centered Leverage Value0.0170.3510.1000.08530其中列出了预测值,标准预测值,预测值标准差等
22、指标的最小值,最大值,平均数,方差。输出多元线性回归方程的标准化残差直方图,可见服从分布3 结论本文利用多元线性回归分析了影响城镇居民人均消费性支出的几个重要因数,并成功的建立了模型,结论表明平均每人年可支配收入,食品支出和就业人员获得国有单位报酬对城镇居民人均消费性支出有影响。其中,对起到最大影响的是平均每人年可支配收入,说明增加人均可支配收入,可以促进居民的消费。并且可以预测到遵义市未来几年的城镇居民人均消费性支出及是的最小值312.5890,最大值7,943.6558,一般来说的城镇居民人均消费性支出保持在2,699.8667平均水平。参考文献1 何晓群.回归分析与经济数据建模M.中国人
23、民大学出版社2002,96-1302 杨永发.概率论与数理统计教程M.南开大学出版社2005,228-2443 何晓群,刘文卿.应用回归分析M.中国人民大学出版社 2001,58-774 胡发胜,宿洁.数理统计M.山东大学出版社 2004,110-1175 吴礼斌,李柏年.数学实验和建模M.国防工业出版社 2007,189-1926 贾乃光,张青,李永慈.数理统计M.中国林业出版社 2005,179-1897 罗积玉,刑瑛.经济统计分析方法及预测M. 北京:中国经济出版社 2002.80-90.8 王学仁,王松桂.实用多元统计分析M. 北京:中国统计出版社 2003.87-909 王萼芳,石生
24、明.高等代数M.北京:高等教育出版社 2003.0910 盛骤,谢式千,潘承毅.概率论与数理统计M.北京:高等教育出版社 2001.1211 姜小鹰,黄子杰,吴小南.SPSS FOR WINDOWS简明教程目录J.福建教育出版社 199912 邓东皋,尹小玲.数学分析简明教程M.下.北京:高等教育出版社 199913 冯力.回归分析方法原理及SPSS实际操作M 2004,114-15414 曹定华,罗汉.多元分析基础M 2001,1-1515 王惠文.偏最小二乘回归方法及其应用M 1998,42-59致谢本论文是在曹正照老师的悉心指导下完成的,在实验过程中,得到了各位同学的指导和帮助,在此对他们表示衷心的感谢!