《人教高中数学选修回归分析.pptx》由会员分享,可在线阅读,更多相关《人教高中数学选修回归分析.pptx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1人教高中数学选修人教高中数学选修(xunxi)回归分析回归分析第一页,共57页。1 1通通过过典典型型案案例例的的探探究究,进进一一步步了了解解回回归归分分析析的的基基本本思思想想、方方法法及其初步应用及其初步应用 2 2让让学学生生经经历历数数据据处处理理的的过过程程,培培养养他他们们对对数数据据的的直直观观感感觉觉,体体会会统统计计方方法法的的特特点点,认认识识统统计计方方法法的的应应用用,通通过过使使用用转转化化后后的的数数据据,求求相相关关指指数数(zhsh)(zhsh),运运用用相相关关指指数数(zhsh)(zhsh)进进行行数数据据分分析析、处处理理的的方方法法 3 3从从
2、实实际际问问题题中中发发现现已已有有知知识识的的不不足足,激激发发好好奇奇心心,求求知知欲欲,通通过过寻寻求求有有效效的的数数据据处处理理方方法法,开开拓拓学学生生的的思思路路,培培养养学学生生的的探探索索精精神神和和转转化化能能力力,通通过过案案例例的的分分析析使使学学生生了了解解回回归归分分析析在在实实际际生生活活中中的的应应用用,增强数学取之生活,用于生活的意识,提高学习兴趣增强数学取之生活,用于生活的意识,提高学习兴趣第1页/共57页第二页,共57页。本本节节课课通通过过必必修修3 3熟熟悉悉有有例例题题回回顾顾线线性性相相关关关关系系知知识识,通通过过实实际际问问题题中中发发现现已已
3、有有知知识识的的不不足足,引引出出随随机机误误差差、残残差差、残残差差分分析析的的概概念念,进进而而运运用用残残差差来来进进行行数数据据分分析析,通通过过例例题题讲讲解解掌掌握握用用残残差差分分析析判判断断线线性性回回归归模模型型的的拟拟合合效效果果。掌握建立回归模型的步骤。掌握建立回归模型的步骤。本本节节内内容容学学生生内内容容不不易易掌掌握握,通通过过知知识识整整理理与与比比较较引引导导学学生生进进行行区区分分(qfn)(qfn)、理理解解。通通过过对对典典型型案案例例的的探探究究,练习进行巩固了解回归分析的基本思想方法和初步应用练习进行巩固了解回归分析的基本思想方法和初步应用第2页/共5
4、7页第三页,共57页。从从某某大大学学中中随随机机选选取取(xunq)8(xunq)8名名女女大大学学生生,其其身身高高和和体体重重数据如下表所示:数据如下表所示:怎怎样样根根据据一一名名女女大大学学生生的的身身高高预预报报她她的的体体重重,并并预预报报一一名名身身高为高为172 cm172 cm的女大学生的体重?的女大学生的体重?编号12345678身高/cm165165157170175165155170体重/kg4857505464614359第3页/共57页第四页,共57页。根据必修根据必修3 2.33 2.3变量相关关系解决这个问题的方法:变量相关关系解决这个问题的方法:1.1.先判
5、断是两个先判断是两个(lin)(lin)变量是否具有线性相关关系变量是否具有线性相关关系(1)(1)作散点图,如图所示作散点图,如图所示(见课本见课本P82P82:图:图3.1-1)3.1-1)2.2.根据线性回归的系数公式,根据线性回归的系数公式,求回归直线方程求回归直线方程 0.849x-85.7120.849x-85.7123.3.由线性回归方程可以估计其位由线性回归方程可以估计其位置值为置值为 60.316(60.316(千克千克)左右。左右。具有具有(jyu)较好的线性相关关系较好的线性相关关系性质:回归直线一定性质:回归直线一定(ydng)过样本中心点过样本中心点(2)(2)计算计
6、算相关系数相关系数第4页/共57页第五页,共57页。这这些些点点并并不不都都在在同同一一条条直直线线上上,上上述述直直线线并并不不能能精精确确(jngqu)地地反反映映x与与y之之间间的的关关系系,y 的的值值不不能能完完全全由由x 确确定定,它它们们之之间间是是统统计计相相关关关关系系,y 的的实实际际值值与与估估计计值值之间存在着误差之间存在着误差因此因此,在统计学中设它们的线性回归在统计学中设它们的线性回归(hugu)(hugu)模模型为型为:其其中中a,ba,b为为模模型型的的未未知知参参数数(cnsh),e(cnsh),e为为y y与与bx+abx+a之之间间的的误误差差,称它为随机
7、误差,它是随机变量。且称它为随机误差,它是随机变量。且线性回归模型完整表达式为线性回归模型完整表达式为x x称为称为_变量变量,y,y称为称为_变量变量.解释解释预报预报第5页/共57页第六页,共57页。线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型中的预报值线性回归模型中的预报值 与真实情况与真实情况y y引起的误差;引起的误差;观测与计算观测与计算(用用 代替代替b a)b a)产生的误差;产生的误差;省略了一些因素的影响省略了一些因素的影响(如生活习惯等)如生活习惯等)产生的误差产生的误差.第6页/共57页第七页,共57页。在线性回归模型中,在线性回归模型中
8、,e e为用为用bx+abx+a的预报真实值的预报真实值y y的随机误差,它的随机误差,它是一个不可观测是一个不可观测(gunc)(gunc)的量,那么应该怎样研究随机误差?的量,那么应该怎样研究随机误差?在实际应用中,我们用在实际应用中,我们用 估计估计 bx+a 所以所以 的估计量为的估计量为对于样本点对于样本点它们的随机误差为它们的随机误差为估计值为估计值为称相应于点称相应于点 的残差的残差第7页/共57页第八页,共57页。坐标纵轴为残差变量,横轴可以有不同的选择;坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确若模型选择的正确(zhngqu)(zhngqu),残差图中的点应该
9、分布,残差图中的点应该分布在以横轴为中心的带形区域;在以横轴为中心的带形区域;对于远离横轴的点,要特别注意。对于远离横轴的点,要特别注意。错误数据模型问题身高与体重残差图异常点残差的作用残差的作用(zuyng)1.1.通过残差表或残差图发现通过残差表或残差图发现(fxin)(fxin)原始数据中的可疑数据原始数据中的可疑数据第8页/共57页第九页,共57页。通过残差通过残差 来判断模型拟合的效果这种来判断模型拟合的效果这种分析工作称为分析工作称为残差分析残差分析第9页/共57页第十页,共57页。通过残差表或残差图判断通过残差表或残差图判断(pndun)(pndun)模型拟合的效果是直观判模型拟
10、合的效果是直观判断断(pndun)(pndun),如何精确判断,如何精确判断(pndun)(pndun)模型拟合的效果?模型拟合的效果?引入参数引入参数(cnsh)R2(cnsh)R2来精确该画模型来精确该画模型(mxng)(mxng)拟合效果拟合效果对对于于己己获获取取的的样样本本数数据据,在在上上式式子子中中 是是定定值值,越越小小,即即残残差差平平方方和和越越小小,R R2 2越越大大,说说明模型拟合效果越好。明模型拟合效果越好。引引入入例例中中参参数数R R2 2计计算算得得约约为为0.640.64说说明明女女大大学学生生体体重重差差异异有有百百分之六十四是由身高引起的分之六十四是由身
11、高引起的.第10页/共57页第十一页,共57页。知识点知识点 线性回归分析线性回归分析1.1.对线性回归模型的三点对线性回归模型的三点(sn din)(sn din)说明说明(1)(1)非非确确定定性性关关系系:线线性性回回归归模模型型y=bx+a+ey=bx+a+e与与确确定定性性函函数数y=bx+ay=bx+a相相比比,它它表表示示y y与与x x之之间间是是统统计计相相关关关关系系(非非确确定定性性关关系系),),其其中中的的随随机机误误差差e e提提供供了了选选择择模模型型的的准准则则以以及及在在模模型合理的情况下探求最佳估计值型合理的情况下探求最佳估计值a a,b b的工具的工具.第
12、11页/共57页第十二页,共57页。(2)(2)线性回归方程线性回归方程 中中 ,的意义是:以的意义是:以 为基数,为基数,x x每增加每增加1 1个单位,个单位,y y相应地平均增加相应地平均增加 个单位个单位.(3)(3)线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源(liyun)(liyun)线性回归模型与真实情况引起的误差;线性回归模型与真实情况引起的误差;观测与计算产生的误差;观测与计算产生的误差;省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差.第12页/共57页第十三页,共57页。2.2.线性回归模型的模拟效果线性回归模型的模拟效果(1)(1)残差图
13、法残差图法:观察残差图观察残差图,如果如果(rgu)(rgu)残差点比较均残差点比较均匀地落在水平的带状区域中匀地落在水平的带状区域中,说明选用的模型比较合说明选用的模型比较合适适,这样的带状区域的宽度越窄这样的带状区域的宽度越窄,说明模型拟合精度越说明模型拟合精度越高高,回归方程的预报精度越高回归方程的预报精度越高.第13页/共57页第十四页,共57页。(2)(2)残残差差的的平平方方和和法法:一一般般情情况况(qngkung)(qngkung)下下,比比较较两两个个模模型型的的残残差差比比较较困困难难(某某些些样样本本点点上上一一个个模模型型的的残残差差的的绝绝对对值值比比另另一一个个模模
14、型型的的小小,而而另另一一些些样样本本点点的的情情况况(qngkung)(qngkung)则则相相反反),),故故通通过过比比较较两两个个模模型型的的残残差差的的平平方方和和的的大大小小来来判判断断模模型型的的拟拟合合效效果果.残残差差平平方方和和越小的模型越小的模型,拟合的效果越好拟合的效果越好.(3)R2(3)R2法法:R2:R2的的值值越越大大,说说明明残残差差平平方方和和越越小小,也也就就是是说说模型拟合的效果越好模型拟合的效果越好.第14页/共57页第十五页,共57页。3.3.相关系数与相关系数与R2R2(1)R2(1)R2是是相相关关系系数数的的平平方方,其其变变化化范范围围(fn
15、wi)(fnwi)为为0,1,0,1,而相关系数的变化范围而相关系数的变化范围(fnwi)(fnwi)为为-1,1.-1,1.(2)(2)相相关关系系数数可可较较好好地地反反映映变变量量的的相相关关性性及及正正相相关关或或负负相相关关,而而R2R2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果.(3)(3)当当|r|r|接接近近于于1 1时时说说明明两两变变量量的的相相关关性性较较强强,当当|r|r|接接近近于于0 0时时说说明明两两变变量量的的相相关关性性较较弱弱,而而当当R2R2接接近近于于1 1时时,说说明明线性回归方程的拟合效果较好线性回归方程的拟合效果较好.第15页/共57
16、页第十六页,共57页。【微思考】【微思考】(1)(1)残差与我们平时说的误差是一回事儿吗残差与我们平时说的误差是一回事儿吗?提提示示:这这两两个个概概念念在在某某程程度度上上具具有有很很大大的的相相似似性性,都都是是衡衡量量不不确确定定性性的的指指标标,二二者者的的区区别别是是:误误差差与与测测量量有有关关,误误差差可可以以衡衡量量测测量量的的准准确确(zhnqu)(zhnqu)性性,误误差差越越大大表表示示测测量量越越不不准准确确(zhnqu);(zhnqu);残残差差与与预预测测有有关关,残残差差大大小小可可以以衡衡量量预预测测的的准准确确(zhnqu)(zhnqu)性性,残差越大表示预测
17、越不准确残差越大表示预测越不准确(zhnqu).(zhnqu).第16页/共57页第十七页,共57页。(2)R(2)R2 2与原来学过的相关系数与原来学过的相关系数r r有区别吗有区别吗?提提示示:它它们们都都是是刻刻画画两两个个变变量量之之间间的的的的相相关关关关系系的的,区区别别是是R R2 2表表示示解解释释变变量量对对预预报报变变量量变变化化的的贡贡献献率率,其其表达式为表达式为R R2 2=1-;=1-;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度,其表达式为其表达式为 第17页/共57页第十八页,共57页。建立回归模型的基本步骤建立回归模型的基
18、本步骤建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)(1)(1)确确确确定定定定研研研研究究究究对对对对象象象象,明明明明确确确确哪哪哪哪个个个个变变变变量量量量是是是是解解解解释释释释变变变变量量量量,哪哪哪哪个个个个变变变变量量量量是是是是预预预预报报报报变量变量变量变量(2)(2)(2)(2)画画画画出出出出确确确确定定定定好好好好的的的的解解解解释释释释变变变变量量量量和和和和预预预预报报报报变变变变量量量量的的的的散散散散点点点点图图图图,观观观观察察察察(gunch)(gunch)(gunch)(gunch)它们之间的关系它们之间的关系它们之间的关系它们之间的关系(如是否
19、存在线性关系等如是否存在线性关系等如是否存在线性关系等如是否存在线性关系等)(3)(3)(3)(3)由由由由经经经经验验验验确确确确定定定定回回回回归归归归方方方方程程程程的的的的类类类类型型型型(如如如如我我我我们们们们观观观观察察察察(gunch)(gunch)(gunch)(gunch)到到到到数数数数据据据据呈呈呈呈线线线线性关系,则选用线性回归方程性关系,则选用线性回归方程性关系,则选用线性回归方程性关系,则选用线性回归方程)(4)(4)(4)(4)按一定规则按一定规则按一定规则按一定规则(如最小二乘法如最小二乘法如最小二乘法如最小二乘法)估计回归方程中的参数估计回归方程中的参数估计
20、回归方程中的参数估计回归方程中的参数(5)(5)(5)(5)得得得得出出出出结结结结果果果果后后后后分分分分析析析析残残残残差差差差图图图图是是是是否否否否有有有有异异异异常常常常(如如如如个个个个别别别别数数数数据据据据对对对对应应应应残残残残差差差差过过过过大大大大,或或或或残残残残差差差差呈呈呈呈现现现现不不不不随随随随机机机机的的的的规规规规律律律律性性性性等等等等)若若若若存存存存在在在在异异异异常常常常,则则则则检检检检查查查查数数数数据据据据是是是是否否否否有误,或模型是否合适等有误,或模型是否合适等有误,或模型是否合适等有误,或模型是否合适等第18页/共57页第十九页,共57页
21、。为研究重量为研究重量x(x(单位:克单位:克)对弹簧长度对弹簧长度y(y(单位:厘米单位:厘米)的影响,对不同的影响,对不同(b tn)(b tn)重量重量的的6 6个物体进行测量,数据如下表所示:个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)(1)作出散点图并求线性回归方程;作出散点图并求线性回归方程;(2)(2)求出求出R2R2;(3)(3)进行进行(jnxng)(jnxng)残差分析残差分析作残差分析时,一般从以下几个方面予以说明:作残差分析时,一般从以下几个方面予以说明:(1)(1)散点散点图;图;(2)(2)相关指数
22、;相关指数;(3)(3)残差图中的异常点和样本残差图中的异常点和样本(yngbn)(yngbn)点的带状分布区域的宽窄点的带状分布区域的宽窄第19页/共57页第二十页,共57页。解答解答(jid)(1)(jid)(1)散点图如图散点图如图 第20页/共57页第二十一页,共57页。0.050.0050.080.0450.040.0252.241.370.540.411.412.31第21页/共57页第二十二页,共57页。(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话(dehu),需要纠正数据,重新建立回归模型;由表中数据可以看出残
23、差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面第22页/共57页第二十三页,共57页。1.1.判一判判一判(正确的打正确的打“”,“”,错误的打错误的打“”)“”)(1)(1)残差平方和越小残差平方和越小,线性回归方程拟合效果线性回归方程拟合效果(xiogu)(xiogu)越越好好.(.()(2)(2)在画两个变量的散点图时在画两个变量的散点图时,预报变量在预报变量在x x轴上轴上,解释变量解释变量在在y y轴上轴上.(
24、)(3)R2(3)R2越接近于越接近于1,1,线性回归方程的拟合效果线性回归方程的拟合效果(xiogu)(xiogu)越好越好.(.()第23页/共57页第二十四页,共57页。2.2.做一做做一做(请把正确的答案写在横线上请把正确的答案写在横线上)(1)(1)从散点图上看从散点图上看,点散布在从左下角到右上角的区域点散布在从左下角到右上角的区域内内,两个变量的这种相关关系为两个变量的这种相关关系为.(2)(2)在残差分析中在残差分析中,残差图的纵坐标为残差图的纵坐标为.(3)(3)如果发现散点图中所有的样本点都在一条直线上如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于则残差平方和
25、等于(dngy)(dngy),解释变量和预报变解释变量和预报变量之间的相关系数量之间的相关系数R R等于等于(dngy)(dngy).正相关正相关(xinggun)(xinggun)残差残差0 01 1或或-1-1第24页/共57页第二十五页,共57页。3.已知某种商品(shngpn)的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求求y对对x的回归直线方程,并说明回归模型拟合的回归直线方程,并说明回归模型拟合(n h)效果的效果的好坏好坏第25页/共57页第二十六页,共57页。00.30.40.10.24.62.60.42.44.4第26页/共5
26、7页第二十七页,共57页。第27页/共57页第二十八页,共57页。第28页/共57页第二十九页,共57页。3.13.1回归分析回归分析(fnx)(fnx)的基本思想及其初的基本思想及其初步应用步应用(第二课时)(第二课时)第29页/共57页第三十页,共57页。1 1通通过过典典型型案案例例的的探探究究,进进一一步步了了解解回回归归分分析析的的基基本本思思想想、方方法及其初步应用法及其初步应用 2 2让让学学生生经经历历数数据据处处理理的的过过程程,培培养养他他们们对对数数据据的的直直观观感感觉觉,体体会会统统计计方方法法的的特特点点,认认识识统统计计方方法法的的应应用用,通通过过使使用用转转化
27、化(zhunhu)(zhunhu)后后的的数数据据,求求相相关关指指数数,运运用用相相关关指指数数进进行行数数据据分分析析、处理的方法处理的方法 3 3从从实实际际问问题题中中发发现现已已有有知知识识的的不不足足,激激发发好好奇奇心心,求求知知欲欲,通通过过寻寻求求有有效效的的数数据据处处理理方方法法,开开拓拓学学生生的的思思路路,培培养养学学生生的的探探索索精精神神和和转转化化(zhunhu)(zhunhu)能能力力,通通过过案案例例的的分分析析使使学学生生了了解解回回归归分分析析在在实实际际生生活活中中的的应应用用,增增强强数数学学取取之之生生活活,用用于于生生活活的的意意识识,提提高高学
28、习兴趣学习兴趣第30页/共57页第三十一页,共57页。本本节节课课通通过过例例题题线线性性相相关关关关系系知知识识,通通过过实实际际问问题题中中发发现现已已有有知知识识的的不不足足,引引导导学学生生寻寻找找解解决决非非线线性性回回归归问问题题思思想想与与方方法法,培培养养学学生生化化归归数数学学思思想想。通通过过知知识识的的整理,通过例题讲解掌握解决非线性回归问题。整理,通过例题讲解掌握解决非线性回归问题。本本节节内内容容学学生生内内容容不不易易掌掌握握,通通过过知知识识整整理理与与比比较较(bjio)(bjio)引引导导学学生生进进行行区区分分、理理解解。通通过过对对典典型型案案例例的的探探
29、究究,练练习习进进行行巩巩固固解解决决非非线线性性回回归归基基本本思思想想方方法法及及初初步应用步应用第31页/共57页第三十二页,共57页。建立回归模型的基本步骤建立回归模型的基本步骤建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)(1)(1)确确确确定定定定研研研研究究究究对对对对象象象象,明明明明确确确确哪哪哪哪个个个个变变变变量量量量是是是是解解解解释释释释变变变变量量量量,哪哪哪哪个个个个变变变变量量量量是预报变量是预报变量是预报变量是预报变量(2)(2)(2)(2)画画画画出出出出确确确确定定定定好好好好的的的的解解解解释释释释变变变变量量量量和和和和预预预预报报报报变变变
30、变量量量量的的的的散散散散点点点点图图图图,观观观观察察察察它它它它们之间的关系们之间的关系们之间的关系们之间的关系(如是否存在如是否存在如是否存在如是否存在(cnzi)(cnzi)(cnzi)(cnzi)线性关系等线性关系等线性关系等线性关系等)(3)(3)(3)(3)由由由由经经经经验验验验确确确确定定定定回回回回归归归归方方方方程程程程的的的的类类类类型型型型(如如如如我我我我们们们们观观观观察察察察到到到到数数数数据据据据呈呈呈呈线线线线性关系,则选用线性回归方程性关系,则选用线性回归方程性关系,则选用线性回归方程性关系,则选用线性回归方程)(4)(4)(4)(4)按一定规则按一定规则
31、按一定规则按一定规则(如最小二乘法如最小二乘法如最小二乘法如最小二乘法)估计回归方程中的参数估计回归方程中的参数估计回归方程中的参数估计回归方程中的参数(5)(5)(5)(5)得得得得出出出出结结结结果果果果后后后后分分分分析析析析残残残残差差差差图图图图是是是是否否否否有有有有异异异异常常常常(如如如如个个个个别别别别数数数数据据据据对对对对应应应应残残残残差差差差过过过过大大大大,或或或或残残残残差差差差呈呈呈呈现现现现不不不不随随随随机机机机的的的的规规规规律律律律性性性性等等等等)若若若若存存存存在在在在(cnzi)(cnzi)(cnzi)(cnzi)异异异异常常常常,则则则则检检检检
32、查查查查数数数数据据据据是是是是否否否否有有有有误误误误,或或或或模模模模型型型型是是是是否否否否合合合合适适适适等等等等第32页/共57页第三十三页,共57页。(6)(6)参数参数R R2 2与相关系数与相关系数r r提示提示:它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的,区别是区别是R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率,其其表达式为表达式为R R2 2=1-;=1-;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度,其表达式为其表达式为 第33页/共57页第三十四页,共57页。(7
33、 7)相关系数)相关系数r r与与R2R2(1)R2(1)R2是是相相关关系系数数的的平平方方(pngfng),(pngfng),其其变变化化范范围围为为0,1,0,1,而相关系数的变化范围为而相关系数的变化范围为-1,1.-1,1.(2)(2)相相关关系系数数可可较较好好地地反反映映变变量量的的相相关关性性及及正正相相关关或或负负相关相关,而而R2R2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果.(3)(3)当当|r|r|接接近近于于1 1时时说说明明两两变变量量的的相相关关性性较较强强,当当|r|r|接接近近于于0 0时时说说明明两两变变量量的的相相关关性性较较弱弱,而而当当R
34、2R2接接近近于于1 1时时,说说明线性回归方程的拟合效果较好明线性回归方程的拟合效果较好.第34页/共57页第三十五页,共57页。例:一只红铃虫产卵数例:一只红铃虫产卵数y和温度和温度x有关,现收集到的一组数有关,现收集到的一组数据如下据如下(rxi)表表1-3表,试建立表,试建立y与与x之间的回归方程。之间的回归方程。第35页/共57页第三十六页,共57页。画出确定好的解释变量和预画出确定好的解释变量和预报变量的散点图,观察报变量的散点图,观察(gunch)(gunch)它们之间的关系它们之间的关系(1)是否(sh fu)存在线性关系?(2)散点图具有哪种函数(hnsh)特征?(3)以指数
35、函数模型为例,如何设模型函数?非线性关系非线性关系指数函数、二次函数、三次函数指数函数、二次函数、三次函数第36页/共57页第三十七页,共57页。cc21设指数函数(zh sh hn sh)曲线 其中 和 是待定参数。ecyxc12=我们可以(ky)通过对数变换把指数关系变为线性关系()这样就可以利用线性回归模型来建立z 与x回归模型,进而找到y与x的非线性回归方程 。*则变换后样本点分布在直线的周围。令)cb,clna(abxz21=+=ylnz=现在问题变为如何估计待定参数 和?cc21非线性回归非线性回归(hugu)模型模型第37页/共57页第三十八页,共57页。(6)ey0.272x-
36、3.843(1)=第38页/共57页第三十九页,共57页。另另一一方方面面,可可以以认认为为图图11-411-4中中样样本本点点集集中中(jzhng)(jzhng)在在某某二二次次曲线曲线因因此此可可以以对对温温度度变变量量做做变变换换,即即令令 然然后后建建立立y y与与t t之之间间的的线线性性回回归归方方程程,从从而而得得到到y y与与x x之之间间的的排排线线性性回回归方程。归方程。,2xt=的附近的附近,其中其中 和和 为待定参数为待定参数.43cc423cxcy+=表表1-51-5是是红红铃铃虫虫的的产产卵卵数数和和对对应应(duyng)(duyng)的的温温度度的的平方,图平方,
37、图1.1-61.1-6是相应的散点图是相应的散点图.第39页/共57页第四十页,共57页。第40页/共57页第四十一页,共57页。第41页/共57页第四十二页,共57页。第42页/共57页第四十三页,共57页。()()()(),b,xgya,xfy21=和和对于给定的样本点 ,两个含有未知数的模型其中a和b都是未知参数,可以按如下的步骤(bzhu)来比较它们的拟合效果.ba 其中 和 分别是参数a、b的估计值(1)分别建立对应于两个模型的回归方程()(),b,xgy 2=()()a ,xfy 1=()()();y yQn1i22ii2=-=()Q1()()y yn1i21ii=-=与(2)分别
38、(fnbi)计算两个回归方程的残差平方和()()()()()()()()()().b,xgy a ,xfy ,;b,xgy a ,xfy,QQ212121的好的效果不如反之的好的效果比则(3)若=第43页/共57页第四十四页,共57页。非线性回归问题的处理方法(1)两个变量不呈线性关系,不能直接利用(lyng)线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.第44页/共57页第四十五页,共57页。(2)非线性回归方程的求法根据原始数据
39、(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础(jch)上通过相应的变换,即可得非线性回归方程.第45页/共57页第四十六页,共57页。(3)非线性相关问题中常见(chn jin)的几种线性变换在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线.下面是几种容易通过变量替换转化为直线的函数模型:第46页/共57页第四十七页,共57页。y=a+,y=a+,令令t=t=,则有,则有y=a+bty=a+bt;y=axy
40、=axb b,令,令z=ln yz=ln y,t=ln xt=ln x,m=ln am=ln a,则有,则有z=m+btz=m+bt;y=aey=aebxbx,令,令z=ln yz=ln y,m=ln a,m=ln a,则有则有z=m+btz=m+bt;y=,y=,令令z=ln y,t=z=ln y,t=,m=ln am=ln a,则有,则有z=m+btz=m+bt;y=a+bln xy=a+bln x,令,令t=ln xt=ln x,则有,则有z=a+btz=a+bt;y=bxy=bx2 2+a,+a,令令t=xt=x2 2,则有,则有y=bt+a.y=bt+a.第47页/共57页第四十八页
41、,共57页。例例 某种食品每公斤的生产成本某种食品每公斤的生产成本y(y(元元)与该食品生产与该食品生产的重量的重量(zhngling)x(zhngling)x(公斤公斤)有关,经生产统计得到有关,经生产统计得到以下数据:以下数据:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15通过以上数据判断(pndun)该食品的成本y(元)与生产的重量x(公斤)的倒数1/x之间是否具有线性相关关系?若有,求出y关于1/x的回归直线方程,并借此估计一下生产该食品500公斤时每公斤的生产成本是多少?(精确到0.01)第48页/共57页第
42、四十九页,共57页。第49页/共57页第五十页,共57页。于是y与1x的回归方程为y8.973x1.125.当x500(公斤)时,y8.9735001.1251.14.即估计生产该食品500公斤时每公斤的生产成本是1.14元 第50页/共57页第五十一页,共57页。X x第51页/共57页第五十二页,共57页。2.为了解(lioji)儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y关于x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176父亲身高父亲身高x(cm)174176176176178儿子身高儿子身高y(cm)175175176177
43、177答案:C解析:方法一:由线性回归直线方程过样本中心(176,176),排除A,B答案,结合(jih)选项可得C为正确答案.方法二:将表中的五组数值分别代入选项验证,可知y=88+12x最适合.第52页/共57页第五十三页,共57页。xx第53页/共57页第五十四页,共57页。xx第54页/共57页第五十五页,共57页。非线性回归问题有时并不给出经验公式非线性回归问题有时并不给出经验公式,这时我们可以画这时我们可以画出已知数据的散点图出已知数据的散点图,把它与学过的各种函数把它与学过的各种函数(hnsh)(hnsh)(幂函幂函数数(hnsh)(hnsh)、指数函数、指数函数(hnsh)(hnsh)、对数函数、对数函数(hnsh)(hnsh)等图象等图象作比较作比较,挑选一种跟这些散点拟合得最好的函数挑选一种跟这些散点拟合得最好的函数(hnsh),(hnsh),然然后采用适当的变量置换后采用适当的变量置换,把问题化为线性回归分析问题把问题化为线性回归分析问题,使之使之得到解决得到解决.第55页/共57页第五十六页,共57页。敬请指导敬请指导(zhdo).第56页/共57页第五十七页,共57页。