《概率论与数理统计(经管).doc》由会员分享,可在线阅读,更多相关《概率论与数理统计(经管).doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基于回归分析的人口预测模型摘要本文采用数理统计中线性回归方程回归分析的方法,对人口总数与年份进行一元线性回归分析,对人口总数作出未来的预测。关键词:回归分析 人口预测 最小二乘法1. 前言人口问题是当今社会最关心的问题之一,有效控制人口数量的增长,分析并预测人口的增长过程,将有利于正确政策的制定。影响人口增长的因素诸多,如人口基数、性别比、战争、疾病、灾难及人口迁移等。由于人口总数很大,在短时间内增长量是微小的,故在建立人口模型是近似认为人口总数是连续的。本文将采用回归分析的方法,分析我国近20年的人口变化,结合回归预测模型,进行人口预测。2. 基本原理回归分析是在研究现象之间相关分析的基础上
2、, 对自变量 x 和因变量 y 的变动趋势拟合数学模型进行数量推算的一种统计分析方法。进行回归分析, 要以现象之间存在相关关系为前提, 然后对自变量 x和因变量 y 的变动拟合适宜的回归方程, 确定其定量关系式, 在对拟合的回归方程进行显著性检验, 最后利用所求得关系式进行推算和预测。回归分析和相关分析的关系非常密切, 两者既有联系又有区别,联系在于, 两者都是对客观事物数量依存关系的分析, 其中回归分析是在相关分析的基础上进行。 如果没有定性的说明现象之间是否存在相关关系, 也没有对这种相关关系的密切程度作量的说明, 就不宜进行回归分析, 即使进行了回归分析, 也不会有什么实际意义。 回归分
3、析不仅可认识事物之间的关系, 更重要的是可运用这种关系推算、 预测未来的发展趋势, 可见回归分析是相关分析的继续和拓展。通过回归分析对现象之间的相关关系拟合回归方程, 就有可能进行推算和预测, 相关分析才能更好地发挥作用。如果仅有相关分析而没有回归分析, 就如有头无尾一样, 失去了统计分析的作用。回归分析和相关分析的区别在于, 两者的概念和作用不同, 它们从不同的角度说明现象之间的依存关系。 相关分析只能说明现象之间是否相关及相关方向和密切程度, 但不能说明一个现象发生一定量的变化, 另一个现象会对应发生多大变化。而回归分析通过建立适宜的回归方程则能够测出这种变化的量, 它是进行推算和预测的重
4、要依据。回归分析预测法,是在分析自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系,因此,回归分析预测法是一种重要的预测方法,当我们在对未来发展状况和水平进行预测时,如果能将影响预测对象的主要因素找到,并且能够取得其数量资料,就可以采用回归分析预测法进行预测。它是一种具体的、行之有效的、实用价值很高的常用预测方法,常用于中短期预测。相关系数, 是在线性相关的条件下, 说明两个现象之间相关关系紧密程度的统计分析指标。r 表示变量 x 和 y 线性相关方向和相关程度, 取值范围在 - 1r1 。当 -
5、 1r0 时相关图分布呈现出 y 随 x 的增加而减少的趋势, 即为负相关当 r=0 时, 相关图分布呈现出不规则状态, 变量 y 不受 x 的影响,表明 x 和 y 之间没有线性相关关系, 但不能随意排斥其它关系, 如可能存在曲线相关系。当 0r。所以,人口总数y对年份x存在显著地线性关系。故可以建立y关于x的线性回归模型。对表1中的数据进行一元线性回归得到:4. 线性回归的显著性检验显著性检验, 可以根据相关系数、 自由度(n-m) 其中n为样本容量,m为回归模型中待定参数的个数) 和给定的显著水平值( 在社会经济现象中, 给定的显著水平值一般为 0.05 ) , 从相关系数检验表中查出临
6、界值 ( n-m ) , 据此判断其线型关系是否成立。如果 r ( n-m ), 表明在显著水平条件下变量之间的线型关系是显著的, 因此将要建立的线型回归模型是很有意义的; 如果 r ( n-m ) , 表明不宜建立线型回归模型, 需要对其进一步分析, 然后再作处理。回归方程建立以后还需要对模型进行检验, 检验回归模型的代表性, 用 F检验法, 若两个变量之间相关程度为高度相关, 方程有很高的代表性, 还不能说明这种直线相关关系是否可靠, 为了说明这种相关关系的可靠性, 必须对相关系数进行分布检验。据此,建立一下检验:检验经计算。因此拒绝,说明年份对人口总数有显著影响,说明回归效果显著。即人口
7、总数关于时间的线性回归关系显著,我们用所求得得回归方程对人口进行预测是可行得。5. 回归方程得检验与应用根据下表2我国人口实际值和预测值得数据进行对比,发现相对误差非常小,说明拟合得效果比较好。根据回归方程预测2015年人口会达到137439.5万人(统计年鉴暂未公布2015年人口数据),2016年人口预计会达到138228.8万人。表2 我国人口实际值与预测值对比年份实际人口预测人口相对误差年份实际人口预测人口相对误差年万人万人%年万人万人%1995121121121653.5-0.44 2005130756129546.50.93 1996122389122442.8-0.04 20061
8、31448130335.80.85 1997123626123232.10.32 2007132129131125.10.77 1998124761124021.40.60 2008132802131914.40.67 1999125786124810.70.78 2009133450132703.70.56 20001267431256000.91 20101340911334930.45 2001127627126389.30.98 2011134735134282.30.34 2002128453127178.61.00 2012135404135071.60.25 2003129227
9、127967.90.98 2013136072135860.90.16 2004129988128757.20.96 2014136782136650.20.10 6. 改进本文选取得是2015年统计年鉴中的人口数据,数据比较权威,但是研究的比较浅显。在设置线性回归方程时只假设有一个变量,进行了一元线性回归,其他因素尚未考虑在内,比如人口基数,迁移率,经济发展和政策等。像现在从计划生育只生一个好变成了二胎政策,对于人口的增长是一个大的变数,人口估计会在回归预测的结果上有所增加。此外,人口对经济的影响也很大,譬如GDP,人口的增加会使得社会劳动力增加进而会有更多的产品和消费的产生,带来了GDP的
10、增长,而随着经济的发展,科技也会进步,更好的生活环境以及教育环境会使人民生活变得更好,甚至会有老龄化延迟的现象,这反过来也会影响人口的发展,几乎是促进人口的增长。所以,影响人口的因素很多,关系比较复杂。当然,本文变量的选取也受到数据的限制,现实生活中可实际事用变量不多。有些变量比如GDP和人均可用地面积 等,也可加入进行相关性分析后,进行筛选变量,建立多元线性回归模型和其他回归模型。7.结束回归分析在各个领域都有广泛的应用,诸如经济领域、医学领域和统计学领域等。本文只采用了回归分析中较为简单的一元线性回归模型进行中国人口的预测,涉及的变量较少,而且我国人口总数对年份的一元线性回归数学模型预测的精确度也比较高,计算较为简单易于使用。但需要指出的是,用此方法进行结果预测的时候,需要注意样本资料的选取,尤其是涉及多个变量之间,注意它们间是否线性相关,严重的需要更换变量或进行预处理,另外还要注意研究的内容影响因变量的因素是否变化明显,如果其他变化因素超过回归方程原有自变量的影响,需要加入该变量进行多元回归。在此,本文不细讲。参考文献1崔鹏,胡晨成. 云南人均受教育程度与人均GDP的一元线性回归分析J. 商场现代化,2010,35:108-109. 2李绍珠. 一元回归分析J. 上海教育科研,1991,02:36-38. 7