《教育专题:1高二数学人教A版选修1-2:1-1回归分析的基本思想及其初步应用课件.ppt》由会员分享,可在线阅读,更多相关《教育专题:1高二数学人教A版选修1-2:1-1回归分析的基本思想及其初步应用课件.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 课程目标课程目标1 1双基目标双基目标(1)(1)通通过过典典型型案案例例的的探探究究,进进一一步步了了解解回回归归分分析析的基本思想、方法及其初步应用的基本思想、方法及其初步应用(2)(2)通通过过典典型型案案例例的的探探究究,了了解解独独立立性性检检验验(只只要要求求2 2 2 2列列联联表表)的的基基本本思思想想、方方法法及及其其初初步步应应用用2 2情感目标情感目标本本章章提提供供了了数数据据处处理理的的方方法法,通通过过对对数数据据的的收收集集、整整理理和和分分析析,使使学学生生认认识识统统计计方方法法的的直直观观特特点点、增增强强学学生生的的社社会会实实践践能能力力,培培养养学学
2、生生分分析析问问题题、解决问题的能力,养成科学严谨的良好品质解决问题的能力,养成科学严谨的良好品质重点难点本章重点:回归分析、残差分析、相关指数的意义以及独立性检验中K2的有关计算本章难点:借助于回归分析的思想选择恰当的模型拟合变量间的相关关系(尤其是非线性的),由于该部分内容的数据相对较复杂,故在高考中出现大题的可能性不是很大,应以选择、填空题为主,旨在考察对回归方程的求解及预测,K2的计算等学法探究本章内容是统计案例中常见方法中的两种:回归分析和独立性的检验通过对典型案例的学习,理解问题和方法的实质,进一步体会统计方法在解决实际问题中的基本思想在学习过程中多与社会实践相结合,亲自动手实践,
3、加深对知识的认识,巩固知识,不断创新,多寻找规律,形成方法11回回归归分析的基本思想及其初分析的基本思想及其初步步应应用用1知识与技能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系2过程与方法通过求线性回归方程,探究相关性检验的基本思想通过对典型案例的探究,体会回归分析在生产实际和日常生活中的广泛应用本节重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法相关指数和残差分析本节难点:解释残差变量的含义,了解偏差平方和分解的思想1通过复习线性回归方程,探究相关性检验的基本思想2培养类比、迁移、化归的能力一、相关关系的概念当一个变量取值一定
4、时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系二、回归分析的相关概念1回归分析是处理两个变量之间的一种统计方法若两个变量之间具有线性相关关系,则称相应的回归分析为 相关关系线性回归分析3线性相关关系强与弱的判断:用 来描述线性相关关系的强弱当r0时,表明两个变量;当r0时,表明两个变量r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间线性相关关系通常当|r|大于时,认为两个变量有很强的线性相关关系4随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不能用一次函数ybxa来描述两个变量之间的关系,而是用线性回归模型来表
5、示,其中 为模型的未知参数,称为随机误差相关系数r正相关负相关几乎不存在0.75ybxaea和beR2的值越大,说明残差平方和越小,也就是说模型的拟合效果越 在线性回归模型中,R2表示解释变量对预报变量变化的R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的线性相关性越强)好贡献率(2)利用图形来分析残差特性,作图时纵坐标为,横坐标可以选为,这样作出的图形称为残差图如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因另外,残差
6、点比较均匀地落在水平的带状区域中,说明选用的模型比较合适这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差样本编号回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法进行转化,转变为线性回归问题例1有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验其中正确命题的个数是()A1B2C3 D4分析由题目可获取以下信息:线性回归分析;散点图;相关性检验等的相关概念及意义解
7、答本题可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论答案C解析反映的正是最小二乘法思想,故正确反映的是画散点图的作用,也正确解释的是回归方程x的作用,故也正确是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系点评线性回归分析的过程:(1)随机抽取样本,确定数据,形成样本点(2)由样本点形成散点图,判定是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势下列有关线性回归的说法,不正确的是()A变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在平面直角坐标系中用描点的方法得到表示具有相关关系的
8、两个量的一组数据的图形叫做散点图C线性回归方程最能代表具有线性相关关系的x,y之间的关系D任何一组观测值都能得到具有代表意义的线性回归方程答案D解析只有对两个变量具有线性相关性作出判断时,利用最小乘法求出线性方程才有意义.例2某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求y关于x的回归直线方程x24568y3040605070解析(1)散点图如图所示(2)列出下表,并用科学计算器进行有关计算.点评求回归直线方程,关键在于正确地求出,由于,的计算量较大,计算时要仔细谨慎、分层进行,避免计算失误例3一个车间为了规定工时定额,需要确定加
9、工零件所花费的时间,为此进行了10次试验,测得数据如下:把零件数x作为解释变量,加工时间y作为预报变量(1)计算总偏差平方和、残差平方和及相关指数;(2)作出残差图;(3)进行残差分析零件数x(个)10203040506070 80 90100加工时间y(min)626875818995102108115122解析(1)由x,y的数据得散点图如图由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型来拟合设线性回归方程为x,列出下表:i12345xi(个)1020304050yi(min)6268758189xiyi620 1360 2250 3240 4450 x678910
10、 xi(个)60708090100yi(min)95102108115122xiyi5700 7140 86401035012200续表将数据代入相应公式可得如下数据表:续表(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残差(3)由题中数据可得样本相关系数r的值为0.9998,再结合散点图可以说明x与y有很强的线性相关关系由R2的值可以看出回归效果很好,也说明用线性回归模型拟合数据效果很好由残差图也可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集在这两个样本点的过程中是否有人为的错误点评本题涉及公式多且复杂,计算量也很大,需首先了解公式,明白原理(2)在利用残差图对数据
11、进行残差分析时,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适这样的带状区域宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图;(4)计算R2;(5)试预测该运动员训练47次及55次的成绩次数(x)30 33 35 37 39 44 46 50成绩(y)30 34 37 39 42 46 48 51解析(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(3)残差分析作残差图如图所示,由图可知,残差点比较均匀地分布在水平
12、带状区域中,说明选用的模型比较合适(4)计算相关指数R2计算相关指数R20.9855.说明了该运动员的成绩的差异有98.55%是由训练次数引起的例4炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液厂炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数x与增大的容积y之间的关系.使用次数x23456789增大的容积y6.428.209.589.509.7010.009.939.99续表解析先根据试验数据作散点图,如图所示使用次数x10111213141516增大的容积y10.4910.5910.6010.8010.6010.9010.76点评作出散点图,由散点图选择合
13、适的回归方程类型是解决本题的关键,在这里线性回归模型起了转化的作用对于非线性回归问题,并没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决例5在一次抽样调查中测得样本的5个样本点数值如下表:试建立y与x之间的回归直线方程x0.250.5124y1612521辨析此题解法是错误的,原因是这两个变量之间不是线性相关关系此类问题的解决,应先对两个变量间的相关关系进行相关性检验,然后结合作出的散点图,选择适宜的回归方程t4
14、210.50.25y1612521由置换后的数值表作散点如图所示:由散点图可以看出y与t呈近似的线性相关关系列表如下:一、选择题1下列说法中错误的是()A如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到的点(xi,yi)(i1,2,n)将散布在某一条直线的附近B如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(i1,2,n)不能写出一个线性方程答案B解析两变量x与y之间不存在线性关系,根据它们的一组数据(xi,yi)(i1,2,3,n)可通过已有的函数知识进行变换,利用线性回归模型来建立y与x之间的非线性回归方程Ay平均增加2.5个单位By平均增加2个单位
15、Cy平均减少2.5个单位Dy平均减少2个单位答案C答案C4下列两个变量之间的关系不是函数关系的是()A角度和余弦值B正n边形的边数和一个内角的度数C棱锥的体积和底面积D某种物质和溶解度和温度答案D6某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:已知y与x之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是_万元答案10解析由本节例2可知y关于x的回归直线方程为6.5x17.5由6.5x17.582.5得x10.故广告费支出最少为10万元x24568y3040605070三、解答题7在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示:1.画出数据的散点图;2根据散点图,你能得出什么结论x(秒)5 10 15 20 30 40 50 60y(微米)6 10 11 13 16 17 19 23解析(1)如图所示:(2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系