《基于主成分回归分析的影响河南省农民收入的因素(共9页).doc》由会员分享,可在线阅读,更多相关《基于主成分回归分析的影响河南省农民收入的因素(共9页).doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上专业 应用统计 学号 z 学院 财经学院基于主成分回归分析的影响河南省农民收入的因素摘要 河南省是传统的农业大省和人口大省,提高农民消费水平,历来是政府关注的重点。在新形势下,农民收入问题已不仅是单纯的“三农”问题,更是一个和国家的宏观经济形势密切相联系、甚至和国际经济变化的大环境相联系的问题。因而本文收集2000-2010年数据,运用主成分回归分析方法建立统计模型,分析影响农民收入的主要因素,得出它们对农民收入增长的贡献率,并根据定量分析结果提出符合实际情况的政策建议。关键字 河南省 农民纯收入 主成分分析 一、河南省农民收入的现状 近些年,河南省农民纯收入自199
2、0年以来是不断上升的,由1990年的527元上升到2010年的5523.73元。在农民增加的收入中,其结构发生了很大的变化,增长率也各不相同。为了分析河南农民收入的影响因素,更快地增加农民收入,使农民的消费和收入都有一个飞跃,就需要对河南省农民收入各个影响因素进行深入研究,从而确定河南农民收入主要影响因素,以便为政府制定发展农村经济、增加农民收入的政策和措施提供依据和建议。基于河南省的实际状况,促进河南省农民收入可持续增长和促进河南省小康社会的全面实现具有更重要的意义。二、指标选择及研究方法的确定(一)指标选取 年份 Y X1 X2 X3 X4 X5 X6 2000 1985.82 1161.
3、58 2294.15 1597.26 23.2 5780.6 12659.90 2001 2097.86 1234.34 2510.45 1788.22 24.4 6078.7 13136.90 2002 2215.74 1288.36 2678.75 1978.37 25.8 6548.2 13127.70 2003 2235.68 1198.70 3310.14 2358.86 27.2 6953.2 13359.80 2004 2253.15 1649.29 4182.10 2722.40 28.9 7521.1 13684.40 2005 2870.58 1892.01 5514.14
4、 3181.27 30.7 7934.2 13789.70 2006 3261.03 1916.74 6724.61 3721.44 32.5 8309.1 13995.39 2007 3851.60 2217.66 8282.83 4511.97 34.3 8718.7 14087.84 2008 4454.24 2658.78 10259.99 5099.76 36.0 9429.3 14181.67 2009 4806.95 2769.05 11010.50 5700.91 37.7 9817.9 14196.59 2010 5523.73 3258.09 13226.38 6607.8
5、9 38.8 10195.9 14248.69表1 2000-2010河南省个指标数据 参考相关文献资料,根据经济理论及实践研究,分析影响农民收入及其增长的主要因素,本文建立模型所选用的因变量Y是河南省农村居民家庭人均纯收入,自变量分别为河南省第一产业人均GDP(X1),第二产业人均GDP(X2),第三产业人均GDP(X3),城镇化水平(X4),农用机械总动力(X5),主要农作物播种面积(X6)。本文用于实证分析的数据是2000-2010 年河南省11年的时间序列资料,见表1,原始数据来源于历年河南省统计年鉴和中国统计年鉴。(二) 研究方法的确定 在实际问题的研究中,为了全面分析问题,往往涉及
6、众多有关的变量,虽然各自变量对因变量都是有意义的,但是某些自变量彼此相关,变量太多不但会增加计算的复杂性,而且也给合理分析问题和解决问题带来困难。因此,需要对回归方程中的变量进行共线性诊断,并且确定它们对参数估计的影响,利用相关性对这些变量加以“改造”,用为数较少的新变量来反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析的基本方法是通过构造原变量的线性组合来产生一系列互不相关的新变量,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替原变量分析问题和解决问题成为可能。因此,利用主成分分析可以很好的解决回归分析中多重共线性问题。
7、本文采用主成分回归分析方法建立模型,主成分回归的原理是用主成分分析提取的主成分与因变量回归建模。由于主成分间具有不相关性,并且能较好的反映原来众多相关性指标的综合信息,因此,用主成分作为新的自变量进行回归分析使得回归方程及参数估计更加可靠。主成分回归分析方法具体步骤为:(1)对P 个自变量(经标准化处理)构成的数据表做主成分分析,得到P个主成分F1,F2,Fp。根据选定的累计贡献率,选取前m个主成分。(2)采用普通最小二乘法,做前m个主成分F1,F2,Fp 对因变量Y的多元线性回归,得到回归模型(3)由于每个主成分F1,F2,Fm 均是自变量X1,X2,Xp 的线性组合,因此,经转化可得最终线
8、性回归模型三 实证研究过程(一) 相关性分析对因变量与所有自变量做相关分析,相关系数矩阵见表2。可见因变量农村居民家庭人均纯收入跟其他自变量的相关性都很强,所以,可以建立因变量与众多自变量之间的线性回归模型,模型具有合理性。表2相关系数矩阵 农村居民家庭人均纯收入(元)第一产业人均GDP(元)第二产业人均GDP(元)第三产业人均GDP(元)城镇化水平(%)农用机械总动力(万千瓦)农作物播种面积(千公顷) 相 关 系 数农村居民家庭人均纯收入(元)1.000.985.995.992.962.959.856第一产业人均GDP(元).9851.000.993.989.970.972.886第二产业人
9、均GDP(元).995.9931.000.998.979.977.891第三产业人均GDP(元).992.989.9981.000.985.984.904城镇化水平(%).962.970.979.9851.000.998.959农用机械总动力(万千瓦).959.972.977.984.9981.000.957农作物播种面积(千公顷).856.886.891.904.959.9571.000(二) 共线性诊断 由于自变量的个数太多,而且由相关系数矩阵表也可以看出自变量之间也存在明显的相关性,这样在建立模型时就可能会出现严重的共线性。为验证是否存在多重共线性问题,首先建立因变量Y 与自变量X1,X
10、2,X9 的多元线性回归模型。从回归结果看,调整后的判定系数R2=0.991,说明模型总体拟合效果非常好。统计量F=183.195,显示回归结果有统计学意义,但参数估计结果显示大多数回归系数并无统计学意义。从共线性诊断结果看,计算各自变量的方差扩大因子,VIF1=108.672,VIF2=487.596,VIF3=425.261,VIF4=770.684 VIF5=472.549 VIF6=40.908,各自变量的方差扩大因子VIF 均大于10,可见自变量之间存在较强的多重共线性,并且这种严重的多重共线性会影响最小二乘估计。本文采用主成分回归分析方法消除多重共线性重新建立回归模型。(三)进行主
11、成分分析 由表3 可知,特征根大于1 的只有一个,所以只提取了一个主成分,此主成分的累计共贡献率是96.923%,说明这一个主成分已经反映了原来6 个自变量96.923% 的信息。表3总体方差解释表ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %15.81596.92396.9235.81596.92396.9232.1632.70999.6323.014.23199.8634.006.10299.
12、9655.001.02299.9876.001.013100.000Extraction Method: Principal Component Analysis. 表4因子得分系数矩阵表示主成分与自变量之间的线性关系,我们可根据因子分析与主成分分析的关系得到主成分分析载荷阵,即,可写出主成分的线性组合如下:表4因子得分系数矩阵Component Zscore:第一产业人均GDP(元.169Zscore:第二产业人均GDP(元).170Zscore:第三产业人均GDP(元).171Zscore:城镇化水平(%).171Zscore: 农用机械总动力(万千瓦).171Zscore: 农作物播种面
13、积(千公顷).163F=0.418ZX1+0.410ZX2+0.412ZX3+0.412ZX4+0.412ZX5+0.163ZX6 (四) 根据主成分再进行线性回归 首先,把农村居民人均纯收入(Y)进行标准化,得到ZY,然后把标准化的农村居民人均纯收入(ZY)和主成分(F)进行简单线性回归分析,得到:Y=(-1.759E-16)+ 0.445F T(0.000 ) (14.846) P(1.000) (0.000) R2=0.956 通过SPSS18.0 软件的分析,得到调整后的可决系数为0.956,有显著的统计学意义。再将上面的式子进行变量代换,得到:Y=3224.61+0.3137X1+0
14、.06X2+0.1349X3+42.33X4+0.1521X5+0.408X6 (五) 结论分析通过分析得到农村居民人均纯收入与第一产业人均GDP,第二产业人均GDP,第三产业人均GDP,城镇化水平,农用机械总动力,主要农作物播种面积之间的关系。从中可以看出,当第一产业人均GDP 增加1%,农村居民人均纯收入将增加0.3137 %;当第二产业人均GDP增加1%,农村居民人均纯收入将增加0.06 %;当第三产业人均GDP 增加1%,农村居民人均纯收入将增加0.1349%;当城镇化水平提高1%,农村居民人均纯收入将增加42.33 %;当农用机械总动力增加1%,农村居民人均纯收入将增加0.1521
15、%;当主要农作物播种面积扩大1%,农村居民人均纯收入将增加0.408%。四、提高农民收入的建议 1.加快第一产业的发展 根据回归分析,第一产业人均GDP 相对于第二、三产业人均GDP来说,对农民收入的增加的促进作用最大。第一产业人均GDP第一产业GDP 总量/ 总人口,所以增加人均GDP 的方法应从两方面入手。一方面,应控制人口的数量,另一方面,应增加第一产业GDP总量。河南省一直是我国人口大省,人口基数很大,特别是在2010年已过亿,所以应适当控制人口。其次,增加第一产业人均GDP 主要应增加第一产业GDP 总量。根据回归分析,当主要农作物播种面积扩大1%,农村居民人均纯收入将增加0.408
16、%。所以扩大主要农作物的播种面积可以促进农民收入的增加。如果简单的看,GDP=最终产品的价格最终产品的产量,由于河南省是被定为农业大省 ,第一产业的GDP 总量主要是农产品的贡献。所以提高GDP 总量可以从两方面入手。从价格来看,农产品价格的提高依赖于农产品的品质,直接的方法是增加农产品的科技含量,提高产品的品质,间接的方法是增加农产品的附加值,进行农产品的深加工。从数量来看,也可以从两方面入手。一方面,通过科学技术手段提高单产,另一方面,提高抵御自然灾害的能力。2.提高城镇化水平 城镇化水平的提高意味着有更多的农村人口进入到城镇中,因为城镇的各项基础设施和福利都要比乡村好,所以农民进城后无论
17、是打工还是自主创业所获得的收入都会远远高于在农村所获得的收入。从模型中可以看到,城市化对农民收入增长的贡献很大。发达国家的经验表明,工业化进入初中期以后,农村人口城市化进程明显加快,从而使农民收入增长进入了主要通过农村人口减少来增加收入的阶段。可见,加快农村城镇化,放宽城市的农民准入条件,改善农民工进城就业的就业环境,鼓励支持有条件的民工回流创业等应该成为城市化,以及农民增收的关键。让大量农民转变为市民,成为工人、商人、企业家,农民的收入水平自然得到提高。3.提高耕地利用率从河南省统计年鉴得知,2006年河南省的耕地保有量始终稳定在1400万公顷以上,并逐年增加,但是土地面积的有限性致使耕地面
18、积的增加不可能无限扩大,所以不能靠单纯的扩大耕地面积来提高农民收入。因此,要提高耕地的利用率。一方面,应该提升耕地质量,保持土壤的肥力,提高土壤有机质含量,进行合理轮作,强化农田水利基础设施建设。另一方面应该提高农业技术水平,选育优良品种,培育出单产高的新品质,加快推广步伐,以增加农作物的单位产量。在耕地面积一定的情况下,农作物种植结构在一定程度上决定着种植业生产的总量和效益的高低,所以必须大力发展高产、优质、高效农业,优化种植结构,不断提高优质、高产农作物的种植比重。参考文献1 丁亮赵玉李维:湖北省农民增收的宏观经济因素分析基于主成分回归模型的分析J.乡镇经济,2007(11):10142 刘润幸:利用SPSS 进行主成分回归分析J.中国公共卫生,2001(8):7467483 吴航黄恒君:农民增收的主成分回归分析J.中国统计,2005(12):29304 郭翔宇罗剑朝曾福生张广胜:中国农业与农村经济发展前沿问题M.北京:中国农业出版社,2007:283专心-专注-专业