《多元线性回归在全国粮食预测中的应用.doc》由会员分享,可在线阅读,更多相关《多元线性回归在全国粮食预测中的应用.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流多元线性回归在全国粮食预测中的应用.精品文档.应用回归分析课程论文论文题目:多元线性回归模型在全国粮食预测中的应用学生姓名: 王淑婷 学 号: 0804100434 专 业: 统计学 班 级: 0804 完成日期:2011年7月2一、引 言耕乃百业之本,仅此一句就说明了农业的重要性,而其中最重要最基础的就是粮食产量的问题,它的高低决定人民的最基本生存是否可以的到保障,确保所有人在任何时候既能买得到又能买得起他们所需的基本食品,每天都能吃得饱,吃的好,吃的健康,是我们大家所希望的,而这样的希望从古至今,一直在人们的心里传播,从未有片刻停留。(一
2、)我国粮食的历史农村改革伊始,1978年1984年,国家实行改革开放的政策,实地农村家庭联产承包经营的正确政策,带来了6年的连续大丰收,平均每年递增5.45%,我国粮食产量从30477亿吨增长到40730亿吨;在转轨时期,1985-1990年粮食总产量的6年大徘徊,除了1985、1988年有大灾外,究其原因,与存在宏观调控和政策方面的失误有关;1993年1998年,粮食产量又从45649亿吨增长到51230亿吨。但是这两次上升之后的变化有所不同,1985年1989年,粮食产量大体稳定,农业生产结构调整效果明显。而1999年2003年,粮食产量下降比较大,2003年仅有4307亿吨,比1998年
3、下降08亿吨。同期农业生产结构虽有所调整,但是,耕地减少的情况非常突出,1999年2004年耕地共减少1亿多亩。尽管其中主要是退耕还林,但是非农建设用地明显增加。因此,2003年国内外粮食价格大涨时,粮食生产的恢复比较缓慢,这样的结果在下面的折线图中也可以看到。(二)我国粮食的现状在旧中国,战乱和灾荒不断,民众流离失所,饥寒交迫,食不果腹,饿死的不在少数,新中国成立以来,特别是改革开放以来,党和政府为解决让农民的吃饭问题倾注了极大地精力。30年的农村改革发展,极大地解放和发展了农村生产力,从根本上改变了农产品长期短缺的状况,才实现了人民填饱肚子的希望。当世界进入2007年的时候,全球粮食危机也
4、慢慢的走来,即便是在这种情况下,我国的粮食产量仍然居高不下,年年创历史新高。在2009年,我国粮食实现连续6年增产,粮食供大于求,国家储备充足。在过去的一年里,2010年,我国粮食总产量达到了10928亿斤,已经连续四年稳定在10000亿斤以上,现在人们吃饱穿暖已不成问题,但我国的粮食发展前景如何,现在仍不能忽视。现在我国粮食产量居高不下,但后续产量又如何?这个问题一直备受大家观注,本文运用计量学方法,通过建立回归模型对我国粮食产量进行科学的预测。 二、文献综述一直以来,粮食产量的问题一直备受大家关注,国内学者在这方面也做了不少的研究,其中大部分对粮食产量做了预测分析,只是运用的方法各不相同,
5、即使方法相同但所选取的指标或是所研究的地区也不相同。接下来我在这里论述两位学者的研究成果,以便说明自己的研究与其不同之处。在基于向前选择变量法的我国粮食总产量多元线性回归预测模型一文中,作者运用向前选择变量法,选取了与之密切相关的粮食单产、粮食播种面积、化肥施用量、有效灌溉面积、农机总动力、农田成灾面积、等6个影响因子序列资料,构建了我国中长期粮食总产量多元线性回归预测模型,结果表明,粮食单产、粮食播种面积、化肥施用量及农田成灾面积是我国粮食总产量的关键制约因子。还有在中国粮食产量虚拟变量模型研究一文中,作者选取粮食产量为被解释变量,粮食面积、农业劳动力、农业机械总动力、面积、化肥用量、成灾面
6、积及2 个虚拟变量( D1 、D2) 为解释变量。经过多元回归,获得了中国粮食产量虚拟变量模型。结果表明,影响中国粮食生产的主要生产要素是化肥用量和农业劳动力,这说明我国的粮食生产尚处在由“粗放型生产”向“集约型生产”过渡时期,适度增加化肥和农业劳动力的投入对粮食生产有一定的促进作用。这两个文献资料都针对粮食产量建立了相应的模型,对其进行预测,但是它们都有一个缺点,就是在选择变量时,没有选取直接影响粮食产量的指标,而是最后在建立模型是一一排除检验不显著的指标。本文在这一方面比较好,首先分析影响粮食产量都有哪些因素,且这些因素的内在联系,最后选出影响最直接的因素作为变量建立回归模型,对我国粮食产
7、量进行中长期预测;然后再利用一阶移动平均模型MA(1)对模型进行修正,得到更准确的模型,对我国粮食产量进行短期预测。三、历史数据分析及来源和指标的选择(一)历史数据分析1.粮食产量随时间的折线图因各年的不同气候、雨量、耕种面积等因素的影响,各年的粮食产量不尽相同,对粮食产量随年份的做折线图见图1。 图1 粮食产量随时间变化的折线图从图1中可以看出,在19782010年间粮食产量基本上呈比较明显的线性上升趋势,只是在局部有波动,例如,很明显在1979、1984、1990、1996、1998、1999是丰收年,而在1985、1988、1997、2003年是欠收年,为了使模型更准确,所以应该在模型中
8、引入虚拟变量。2.虚拟变量的设计本文的虚拟变量表达的意思为丰收或欠收,虚拟变量的计算公式见(1)。 (1) 其中表示虚拟变量,K=,-2,-1,0,1,2 K=0对应样本期中初始正常年每年平均正常增长量=732.3运用公式(1)分别计算出的值。(二)指标的选择考虑到影响粮食收入的因素有化肥施用量、有效灌溉面积、机耕面积、播种面积、每亩耕地用电量、农家肥用量、优良品种使用、降水量、气温、干热风以及日照等,但是后六个的数据不好找,所以在这里只考虑前面几个因素;其中每亩耕地用电量与有效灌溉面积有密切的关系,所以只需考虑一个变量即可,在这里选取有效灌溉面积;对于机耕面积,我们大家都有目共睹它在不断的减
9、少,即是在不断减少,但我国的粮食产量一直保持上涨趋势(各年之间小范围的波动不影响总体趋势),其原因何在我们大家也知道,就是耕种技术有了显著的提高,也可以说技术的提高弥补了耕地面积的减少,所以本文把耕地面积作为常量处理,即它对粮食产量的影响不大,所以可以直接排除在指标外。经过以上分析,我们选取的指标有化肥施用量(X1)、有效灌溉面积(X2)、机耕面积(X3)和虚拟变量D。进一步对其进行分析,计算出它们的偏相关系数分别为,从自变量与Y之间的相关系数可以看出,只有X1和Y有显著的相关关系,X2、X3与Y的关系不大,在这里可以不考虑;从各变量之间的相关系数可以看出,X2与X3有明显的相关关系,X2与X
10、1有弱的相关关系,都可能会存多重共线性。综合以上两种说法,我们可以剔除掉变量X2和X3。(三)数据来源 本文数据大部分来自2010中国统计年鉴或中华人民共和国国家统计局网站,只有机耕面积这一个指标从19781989年的数据来自与CNKI数据库,自19902008年的数据来自各年的中国农业年鉴。数据见附录。四、模型的构建(一)变量经分析知机耕面积和有效灌溉面积对全国粮食产量影响不大,已被剔除掉,所以本文所选择的变量有,因变量为全国粮食产量Y,解释变量为化肥施用量X1和虚拟变量D。所选变量的时间为19782008,共31个样本。(二)函数形式根据图1以及对图1的分析知,该模型的函数形式为简单的线性
11、函数形式,其函数形式为:五、模型的估计与检验(一)模型的估计与检验运用SPSS对模型进行估计,结果如下。 (83.35) (55.666)(22.617) (0.00) (0.00) (0.00)第一行的小括号里的是t统计量的值,第二行的是t统计量的伴随概率。其中=0.991,DW=0.662,F统计量=1555.267,P(F)=0.00。从以上的估计结果可以看出,各变量的系数均通过了t检验,且模型拟合的较好,变量整体对Y的解释程度高,从DW的值得出存在自相关,但本文是对Y通过建立回归模型进行中长期预测,只需总体情况较好即可,所以该模型可以使用。(二)模型的估计与检验 上面建立的模型存在自相
12、关,在该模型中引入滞后一期的残差项()作为新的变量,运用一阶移动平均模型,建立新的回归模型,其结果如下。 (98.781) (67.572) (28.884) (4.566) (0.00) (0.00) (0.00) (0.00) 第一行的小括号里的是t统计量的值,第二行的是t统计量的伴随概率。其中=0.994,DW=2.009,F统计量=1524.778,P(F)=0.00。从以上的估计结果可以看出,各变量的系数均通过了t检验。从看出模型拟合的较好,与模型比较,、DW的值均变大了,不存在自相关,且变量整体对Y的解释程度也较好。但是该模型存在相,所以只能对Y做短期预测。六、运用模型进行事后预测
13、,检测模型的效果(一)运用模型对粮食产量进行短期和中长期的预测,并计算出。1.对2009年粮食产量进行短近期事后预测已知2009年粮食实际产量为Y=53082.08,X1=5404.4,取估计值D=-0.52,把X1和D带入模型的方程中得,而=Y-=53082.08-50827.31=2254.77,即绝对误差为2254.77,且相对误差为4.25%。2.对20102012年的粮食产量进行短近期预测已知2010年的估计值为X1=5598.04,D=-0.70;2011年的估计值为X1=5745.22,D=-0.88;2012的估计值为X1=5892.39,D=-1.06。分别把各年的X1和D带
14、入模型的方程中得2010、2011和2012年的预测值分别为53422.62、54021.85和54621.04。在这里计算出2011年的相对误差为1.77%。3.对2015和2020年的粮食产量进行中长期预测已知2015年的估计值为X1=6333.90,D=-1.60;2020年的估计值为X1=7069.76,D=-2.50。分别把X1和D带入模型的方程中得2015和2020年的预测值为56414.66和59414.59。(二)运用模型对2009年粮食产量进行短期预测1.对2009年粮食产量进行短近期事后预测同样,已知2009年粮食实际产量为Y=53082.08,X1=5404.4,估计值D
15、=-0.52,=30.84,把X1、D和带入模型中得,而=Y-=53082.08-50848.16=2233.92,即绝对误差为2233.92,且相对误差为4.21%,对比模型中的,这里的误差要稍微小点,说明模型在短期的粮食预测中具有优势。2.对2010和2011的粮食产量进行短近期预测已知2010年的估计值为X1=5598.04,D=-0.70,=33.61;2011年的估计值为X1=5745.22,D=-0.88,=36.38。分别把X1、D和带入模型的方程中得到2010和2011年的预测值分别为53445.96和54045.64。计算出2011年的相对误差为1.82%,对比模型中的,这里
16、的误差要稍微大点,说明模型在进行近期以及中长期的粮食预测中具有优势。七、本文的不足之处由于本文是运用模型对我国的粮食产量进行预测,而这样得出来的结果只是建立在理论上,没有考虑到现实中的影响因素,而现实中的影响因素也无从预知,所以在做预测是难免会与实际值有出入,这一点是无法避免的。参考文献1彭逢瑞.多元线性回归模型在陕西省粮食预测中的应用J.陕西经济统计年鉴,1987,(1-6):2刘东,白雪峰,孟军.基于向前选择变量法的我国粮食总产量多元线性回归预测模型J.东北农业大学学报,2010,41(10):124128.3吕爱清,杜国平,卞新民,陈路杨,丘爱保.中国粮食产量虚拟变量模型研究J.安徽农业科学,2005,33(11):21362137,2155.4尹成杰.粮安天下M.北京.中国经济出版社,2009.附 录