《回归分析的初步应用优秀PPT.ppt》由会员分享,可在线阅读,更多相关《回归分析的初步应用优秀PPT.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、回归分析的初步应用第1页,本讲稿共26页问题情境问题情境v据统计据统计1993年到年到2002年年中国的国内生产总值中国的国内生产总值(GDP)的数据如下)的数据如下:v能否根据提供的数据,建能否根据提供的数据,建立一个合适的模型,预报立一个合适的模型,预报2003年(或年(或2009年)的年)的GDP是多少?是多少?年份年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197313.82002104790.6第2页,本讲稿共26页v探究探究1:结合以上
2、数据,猜想他们的关系是什:结合以上数据,猜想他们的关系是什么?么?v探究探究2:你选择了什么样的回归模型?根据自:你选择了什么样的回归模型?根据自己得到的模型,预报己得到的模型,预报2003年的(年的(GDP)?)?问题探究问题探究第3页,本讲稿共26页回顾复习回顾复习回归分析方法研究问题的步骤:回归分析方法研究问题的步骤:(1)(1)选择变量画出散点图。选择变量画出散点图。(2)(2)求回归直线方程。求回归直线方程。(3)(3)用回归直线方程进行预报用回归直线方程进行预报 第4页,本讲稿共26页合作探究合作探究 (1)由表中数据制作散点图如下由表中数据制作散点图如下年份年份GDP199334
3、634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197313.82002104790.6第5页,本讲稿共26页回归直线方程回归直线方程:相关系数:相关系数:第6页,本讲稿共26页(2)用用 yi 表示表示GDP值,值,t 表示年份。根据截距和斜率表示年份。根据截距和斜率的最小二乘计算公式的最小二乘计算公式从而的线性回归方程从而的线性回归方程2003年的年的GPP预报值为预报值为112976.4第7页,本讲稿共26页v问题问题2:预报值一定是实际值吗?误差是多少?:预报值一定
4、是实际值吗?误差是多少?(根据国家统计局(根据国家统计局2004年的统计,年的统计,2003年实际值为年实际值为117251.9,预报与实际相差,预报与实际相差-4275.5)v问题问题3:你认为你得到的模型能较好的刻画:你认为你得到的模型能较好的刻画GDP和年份和年份的关系吗?能说明理由吗?的关系吗?能说明理由吗?问题探究第8页,本讲稿共26页第9页,本讲稿共26页残差残差残差平方和残差平方和相关指数相关指数第10页,本讲稿共26页问题探究问题探究 GDP值与年份线性拟合残差表值与年份线性拟合残差表年份年份19931994199519961997残差残差-6422.269-1489.2383
5、037.4935252.0244638.055年份年份19981999200020012002残差残差1328.685-2140.984-1932.353-1277.622-993.791第11页,本讲稿共26页回归方程的相关指数:回归方程的相关指数:说明年份能够解释说明年份能够解释97%的的GDP值变化,因此所建值变化,因此所建的模型能够很好的刻画的模型能够很好的刻画GDP和年份的关系。和年份的关系。第12页,本讲稿共26页建构数学模型建构数学模型v我们将我们将y=bx+a+e 称为线性回归模型其中称为线性回归模型其中a,b为为模型的未知参数,解释变量模型的未知参数,解释变量x,预报变量,预
6、报变量y,e称为随称为随机误差。机误差。v思考思考1:e产生的主要原因是什么?产生的主要原因是什么?(1)所用确定函数模型不恰当;所用确定函数模型不恰当;(2)忽略了某些因素的影响;忽略了某些因素的影响;(3)观测误差。观测误差。第13页,本讲稿共26页思考思考2:如何检查拟合效果的好坏如何检查拟合效果的好坏?(1)散点图(2)相关系数(3)残差分析(4)回归效果的相关系数第14页,本讲稿共26页被害棉花 红铃红铃 虫喜高温高湿,适宜各虫态发育的虫喜高温高湿,适宜各虫态发育的温度为温度为 25一一32C,相对湿度为,相对湿度为80一一100,低于低于 20C和高于和高于35C卵不能孵化,相对湿
7、度卵不能孵化,相对湿度60 以下成虫不产卵。冬季月平均气温低以下成虫不产卵。冬季月平均气温低于一于一48 时,红铃虫就不能越冬而被冻时,红铃虫就不能越冬而被冻死。死。问题情景问题情景 1953 1953年,年,1818省发生红铃虫大灾害,受灾面积省发生红铃虫大灾害,受灾面积300300万公顷,损失皮棉约二十万吨。万公顷,损失皮棉约二十万吨。第15页,本讲稿共26页温度温度xoC21232527293235产卵数产卵数y/个个711212466115325例例2、现现收收集集了了一一只只红红铃铃虫虫的的产产卵卵数数y和和温温度度x之之间间的的7组组观观测数据列于下表:测数据列于下表:(1 1)试
8、试建建立立产产卵卵数数y y与与温温度度x x之之间间的的回回归归方方程程;并预测温度为并预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解)你所建立的模型中温度在多大程度上解释了产卵数的变化?释了产卵数的变化?问题呈现:第16页,本讲稿共26页假设线性回归方程为假设线性回归方程为:=bx+a选变量选变量画散点图画散点图选选 模模 型型分析和预测分析和预测估计参数估计参数由计算器得:线性回归方程为由计算器得:线性回归方程为y=19.87x-463.73相关指数相关指数R2=r20.8642=0.7464 解:选取气温为解释变量解:选取气温为解释变
9、量x,产卵数为预,产卵数为预报变量报变量y。所以,二次函数模型中温度解释了所以,二次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。问题探究问题探究0 050501001001501502002002502503003003503500 03 36 69 91212151518182121242427273030333336363939方案1当当x=28时,时,y=19.8728-463.73 93第17页,本讲稿共26页教法9366!?模型不好?模型不好?奇怪?奇怪?第18页,本讲稿共26页 y=bx2+a 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系方案2问题问
10、题选用选用y=bx2+a,还是,还是y=bx2+cx+a?问题问题3 产卵数产卵数气气温温问题问题2如何求如何求a、b?合作探究合作探究第19页,本讲稿共26页方案2解答平方变换:平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为就转化为产卵数产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作作散散点点
11、图图,并并由由计计算算器器得得:y y和和t t之之间间的的线线性性回回归归方方程程为为y=y=0.3670.367t t-202.54-202.54,相关指数,相关指数R R2 2=r r2 20.8960.8962 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得:y=y=0.3670.367x x2 2-202.54-202.54当当x x=28=28时时,y y=0.36728=0.367282 2-202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%8
12、0.2%的产卵数变化。的产卵数变化。t教法0.367-202.54R2=r20.8962=0.802y=0.367x2-202.54第20页,本讲稿共26页问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气气温温指数函数模型指数函数模型方案3合作探究合作探究教法对数对数第21页,本讲稿共26页令令 ,则,则 就转换为就转换为z=bx+a 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得方案3解答温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.
13、51产卵数产卵数y/个个711212466115325xz由计算器得:由计算器得:z关于关于x的线性回归方程的线性回归方程为为z=0.118x-1.665,相关指数相关指数R2=r20.99252=0.985当当x=28oC 时,时,y 44,指数回归模型中温度,指数回归模型中温度解释了解释了98.5%的产卵数的变化的产卵数的变化第22页,本讲稿共26页最好的模型是哪最好的模型是哪个个?产卵数产卵数气气温温产卵数产卵数气气温温线性模型二次函数模型指数函数模型教法第23页,本讲稿共26页函数模型函数模型相关指数相关指数R2线性回归模型线性回归模型0.7464二次函数模型二次函数模型0.802指数
14、函数模型指数函数模型0.985最好的模型是哪个最好的模型是哪个?教法比一比第24页,本讲稿共26页 选修选修1-2:P13-3练习练习小结小结:(1)如何发现两个变量的关系?)如何发现两个变量的关系?(2)如何选用、建立适当的非线性回归模型)如何选用、建立适当的非线性回归模型?(3)如何比较不同模型的拟合效果?)如何比较不同模型的拟合效果?归纳小结归纳小结第25页,本讲稿共26页课后作业课后作业v查阅有关资料了解我国2008,2009年的国内生产总值,分析由回归方程计算结果产生误差的原因,预测2010年国内生产总值。v就自己感兴趣的问题,利用学过的有关统计知识,写一篇关于预测、决策的文章。(如股市、房价、大学生就业等等社会热点问题)第26页,本讲稿共26页