《数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用2 新人教A版选修1-2 .ppt》由会员分享,可在线阅读,更多相关《数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用2 新人教A版选修1-2 .ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 统计案例1.1 回归分析的基本思想及其初步应用为农村居民建立健康档案管理系统为农村居民建立健康档案管理系统 艺考的美女们艺考的美女们标准体重表的制作标准体重表的制作l假设某地区从假设某地区从20032003年到年到20122012年的人均年的人均GDPGDP(单位(单位/美元)美元)数据如图数据如图:l能否根据提供的数据,建立能否根据提供的数据,建立一个合适的模型,预报一个合适的模型,预报20142014年(或年(或20152015年)的人均年)的人均GDPGDP是是多少?多少?年份年份人均人均GDPGDP2003200312001200200420041510151020052005
2、1870187020062006221022102007200725702570200820083000300020092009367036702010201045004500201120115430543020122012610061001.1.了解回归分析的基本思想了解回归分析的基本思想.2.2.会对两个变量进行回归分析会对两个变量进行回归分析.(重点重点)3.3.明确解决回归模型的基本步骤,并对具体问题进明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题行回归分析以解决实际应用问题4.4.了解最小二乘法的推导,解释残差变量的含义了解最小二乘法的推导,解释残差变量的含义
3、.5.5.了解偏差平方和分解的思想,了解判断刻画模型了解偏差平方和分解的思想,了解判断刻画模型拟合效果的方法拟合效果的方法相关指数和残差分析相关指数和残差分析6.6.掌握利用计算器求线性回归直线方程参数及相关掌握利用计算器求线性回归直线方程参数及相关系数的方法系数的方法.(难点)难点)探究点探究点1 1 回归分析的基本思想回归分析的基本思想身高身高/cm/cm体重体重/kg/kg思考:如何发现数据中的错误?如何衡量模型的拟思考:如何发现数据中的错误?如何衡量模型的拟合效果?合效果?可以通过残差发现原始数据中的可疑数据,判可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果断所建立模型
4、的拟合效果.下表列出了女大学生身下表列出了女大学生身高和体重的原始数据以及相应的残差数据高和体重的原始数据以及相应的残差数据.从图从图1.1-41.1-4中可以看出,第中可以看出,第1 1个样本点和第个样本点和第6 6个样本个样本点的残差比较大,需要确认在采集这两个样本点的过程点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误中是否有人为的错误.如果数据采集有错误,就予以纠如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因采集没有错误,则需要寻找其他的原因.另外,残差点另
5、外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比比较均匀地落在水平的带状区域中,说明选用的模型比较合适较合适.这样的带状区域的宽度越窄,说明模型拟合精这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高度越高,回归方程的预报精度越高.在研究身高和体重的关系时,求得相关指数在研究身高和体重的关系时,求得相关指数 _,可以叙述为,可以叙述为“身高解释了身高解释了64%64%的的体重变化,而随机误差贡献了剩余的体重变化,而随机误差贡献了剩余的36%36%”所以身所以身高对体重的效应比随机误差的效应大得多高对体重的效应比随机误差的效应大得多.【即时训练即时训练】探究点探究点
6、2 2 回归分析的初步应用回归分析的初步应用产卵数产卵数/个个当回归方程不是形如当回归方程不是形如y=y=bx+abx+a(a(a,bRbR)时,称之为时,称之为非线性回归方非线性回归方 程程.x xz zt ty y如如图四个散点四个散点图中中,适合用适合用线性回性回归模型模型拟合其中两个合其中两个变量的是量的是()A.A.B.B.C.C.D.D.B B【即时训练即时训练】1.1.下列有关回下列有关回归直直线方程方程 =x+=x+的叙述:的叙述:反映反映 与与x x之之间的函数关系的函数关系;反映反映y y与与x x之之间的函数关系的函数关系;表示表示 与与x x之之间不确定关系不确定关系;
7、表示最接近表示最接近y y与与x x之之间真真实关系的一条直关系的一条直线.其中正确的是其中正确的是()A.B.A.B.C.C.D.D.C C2.2.有下列说法有下列说法:在残差图中在残差图中,残差点比较均匀地落残差点比较均匀地落在水平的带状区域内在水平的带状区域内,说明选用的模型比较合适说明选用的模型比较合适.用相关指数用相关指数R R2 2来刻画回归的效果来刻画回归的效果,R,R2 2值越大值越大,说明模说明模型的拟合效果越好型的拟合效果越好.比较两个模型的拟合效果比较两个模型的拟合效果,可可以比较相关系数的大小以比较相关系数的大小,相关系数越大的模型相关系数越大的模型,拟合拟合效果越好效
8、果越好.其中正确命题的个数是()其中正确命题的个数是()A.0A.0B.1B.1C.2C.2D.3D.3C C3.3.设变量设变量x x,y y的回归方程是的回归方程是 ,若变量,若变量x x增加增加1.21.2个单位时,个单位时,y y平均减少平均减少3 3个单位,则个单位,则 =()A.-2.5 B.2.5 A.-2.5 B.2.5 C.-0.4 D.0.4C.-0.4 D.0.4A A 4.4.对于一于一组数据的两个函数模型数据的两个函数模型,其残差平方和分其残差平方和分别为85.285.2和和190.5,190.5,若从中若从中选取一个取一个拟合程度合程度较好的函数模好的函数模型型,应
9、选_(_(填填“前者前者”“后者后者”).).【解析解析】残差平方和越小残差平方和越小(大大)函数模型对数据的拟合效函数模型对数据的拟合效果越好果越好(差差),),故选前者故选前者.前者前者5.5.已知方程已知方程 是根据女中学生的身是根据女中学生的身高预报她的体重的回归方程,其中高预报她的体重的回归方程,其中x的单位是的单位是cm,的单位是的单位是kg,若某女同学的实际体重为,若某女同学的实际体重为53kg,她的,她的体重的估计值相对于实际体重的残差是体重的估计值相对于实际体重的残差是-0.29kg,则,则这位女同学的身高是这位女同学的身高是 .160cm160cmB B回归分析回归分析 统计案例统计案例独立性检验独立性检验线线 性性非线性非线性列联表列联表等高条形图等高条形图独立性检验步骤独立性检验步骤 实现自己既定的目标,必须能耐得住寂寞单干.