《23《变量间的相关关系2》(新人教A版必修3).ppt》由会员分享,可在线阅读,更多相关《23《变量间的相关关系2》(新人教A版必修3).ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、v主讲老师 潘学国问题提出问题提出1 1、两个变量之间的相关关系的含义如何?成、两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别正相关和负相关的两个相关变量的散点图分别有什么特点?有什么特点? 自变量取值一定时,因变量的取值带有一自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系定随机性的两个变量之间的关系. . 正相关的散点图中的点散布在从左下角到正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域从左上角到右下角的区域 2 2、观察人体的脂肪含量百分比和年龄的样本
2、数据、观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关的散点图,这两个相关变量成正相关. .我们需要进我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论含量到底是以什么方式增加呢?对此,我们从理论上作些研究上作些研究. .第二课时第二课时思考:思考:一组样本数据的平均数是样本数据的中一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?一定是散点图中的点吗? ( , )x y思考:思考:在各种各样的
3、散点图中,有些散点图中的点是在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?的分布有什么特点? 这些点大致分布在一条直线附近这些点大致分布在一条直线附近. .思考:思考:如果散点图中的点的分布,从整体上看大致在如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有一条直线附近,则称这两个变量之间具有线性相关关线性相关关系系,这条直线叫做,这条直线叫做回归直线回归直线. .对具有线性
4、相关关系的对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?两个变量,其回归直线一定通过样本点的中心吗?思考:思考:对一组具有线性相关关系的样本数据,你认为对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?其回归直线是一条还是几条?思考:思考:在样本数据的散点图中,能否用直尺准确画出在样本数据的散点图中,能否用直尺准确画出回归直线?回归直线? 在直角坐标系中,任何一条直线都有相在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为应的方程,回归直线的方程称为回归方程回归方程. .对对一组具有线性相关关系的样本数据,如果能一组具有线性相关关系的样本数据,如果
5、能够求出它的回归方程,那么我们就可以比较够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计并根据回归方程对总体进行估计. . 思考:思考:回归直线与散点图中各点的位置应具有怎样的回归直线与散点图中各点的位置应具有怎样的关系?关系? 整体上最接近整体上最接近 思考:思考:对于求回归直线方程,你有哪些想法?对于求回归直线方程,你有哪些想法? 整体上最接近整体上最接近 采用测量的方法:先画一条直线,测量出采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离各点到它的距离,然后移
6、动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。就得到回归方程。 在图中选取两点画直线,使得直线在图中选取两点画直线,使得直线两侧的点的个数基本相同。两侧的点的个数基本相同。脂肪010203040020406080脂肪 在散点图中多取几组点,确定几条直线的方在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。两个平均数作为回归方程的斜率和截距。脂肪010203040020406080脂肪 上述三种方案均有
7、一定的道理,但可靠性上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的不强,我们回到回归直线的定义定义。求回归方程的关键是如何用数学的方法来刻画求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小从整体上看,各点与直线的偏差最小”。 如果散点图中点的分布从如果散点图中点的分布从整体整体上看大致在上看大致在一条直线附近,我们就称这两个变量之间具有一条直线附近,我们就称这两个变量之间具有线性相关关系线性相关关系,这条直线就叫做,这条直线就叫做回归直线回归直线。 设已经得到具有线性相关关系的变量的一组数据:设已经得到具有线性相关关系的变量的一组数据:(x x1 1,y
8、 y1 1),(),(x x2 2,y y2 2),),(,(x xn n,y yn n) 设所求的回归直线方程为设所求的回归直线方程为 其中其中a a,b b是待定的系数。是待定的系数。 我们可以用点我们可以用点 与这条直线上横坐标为与这条直线上横坐标为 的点之间的距离来刻画的点之间的距离来刻画 到直线的远近,即用到直线的远近,即用 (i=1i=1,2 2,n n)表示点表示点 到直线的远近。到直线的远近。abxy+=|)(abxyyyiiii+=-(x1, y1)(x2,y2)(xi,yi)(xn,yn)()iiyx ,ix()iiyx ,()iiyx , 这样,用这这样,用这n个距离之和
9、来刻画各点与此直线的个距离之和来刻画各点与此直线的“整体距离整体距离”是比较合适的,即用是比较合适的,即用表示各点到直线的表示各点到直线的“整体距离整体距离”。| )(|.| )(| )(| )(|abxyabxyabxyabxynninii+=+=-22111)(niiiabxyQ12-= 由于绝对值使得计算不方便,在实际应用中人们由于绝对值使得计算不方便,在实际应用中人们更喜欢用更喜欢用 即:即:问题归结为问题归结为:a,b取什么值时取什么值时Q最小,即总体和最小。最小,即总体和最小。 下面是计算回归方程的斜率和截距的一般公式下面是计算回归方程的斜率和截距的一般公式:x xb b- -y
10、y= =a a, ,x xn n- -x xy yx xn nx x= =) )x x( (x x) )y y) )( (y yx x( (x x= =b bn n1 1= =i i2 22 2i in n1 1= =i ii in n1 1= =i i2 2i in n1 1= =i ii ii i-y-i回归方程:回归方程: y = bx + a 这种通过求这种通过求Q最小值而得到回归直线的方法,即最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的使得样本数据的点到回归直线的距离的平方和最小的方法叫做方法叫做最小二乘法最小二乘法。求样本数据的线性回归方程,可按下列
11、步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第二步,计算平均数第二步,计算平均数 , , ;xy第三步,写出回归方程第三步,写出回归方程 y = bx + a第一步,画散点图,判断变量是否线性相关;第一步,画散点图,判断变量是否线性相关; 求和求和 , , ; niiiyx1=niix12= 计算计算 ;xbyaxnxyxnyxbniiniii,-1221=思考:思考:利用计算器或计算机可求得年龄和人体脂肪含利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为量的样本数据的回归方程为 ,由此我们可以根据一个人年龄预测其体内脂肪含量的由此我们可以根据一个人年龄预测其体内脂肪
12、含量的百分比的回归值。若某人百分比的回归值。若某人3737岁,则其体内脂肪含量的岁,则其体内脂肪含量的百分比约为多少?百分比约为多少?20.9% y = 0.577x 0.448摄氏温度摄氏温度() -504712热饮杯数热饮杯数 15615013212813015192327313611610489937654(1 1)画出散点图;)画出散点图;(2 2)从散点图中发现气温与热饮杯数之间关系的一般规律;)从散点图中发现气温与热饮杯数之间关系的一般规律;(3 3)求回归方程;)求回归方程;(4 4)如果某天的气温是)如果某天的气温是22,预测这天卖出的热饮杯数,预测这天卖出的热饮杯数. . 例
13、:例:有一个同学家开了一个小卖部,他为了研究气温对有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:天气温的对比表: 理论迁移理论迁移当当x=2时,时,y=143.063。练习练习x1234y1/23/2231、已知变量、已知变量x和变量和变量y有下列对应数据有下列对应数据则则y对对x的回归直线方程是什么?的回归直线方程是什么?x2 2、设有一个回归方程、设有一个回归方程,当变量,当变量增加增加1 1个单位时(个单位时( )y A平均增加平均增加2个单位个单位CD平均增加平均增加3
14、个单位个单位平均减少平均减少2个单位个单位平均减少平均减少3个单位个单位.Bxy23+=y y y 3、线性回归方程表示的直线线性回归方程表示的直线必经过点必经过点( )A(6,0) B(0,6) C(1,6) D(6,1)4、线性回归方程表示的直线线性回归方程表示的直线必经过点必经过点( )A(0,0)xB(,0)yC(0,)D( , )xy 6、已知回归方程、已知回归方程 =4.4x+838.19,则可估计,则可估计x与与y的增长速度之比约为的增长速度之比约为_.y bxy+= 6bxay+=810-50.xy =5、已知、已知回归方程回归方程 ,则则x=25时时y的估计的估计值为值为_。
15、课时小结课时小结: :1 1、回归方程被样本数据惟一确定,各样本点大、回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近致分布在回归直线附近. .对同一个总体,不同的对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也样本数据对应不同的回归直线,所以回归直线也具有随机性具有随机性. . 2 2、对于任意一组样本数据,利用上述公式都可、对于任意一组样本数据,利用上述公式都可以求得以求得“回归方程回归方程”,如果这组数据不具有线性,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的相关关系,即不存在回归直线,那么所得的“回回归方程归方程”是没有实际意义的是没有实际意义的. .因此,对一组样本因此,对一组样本数据,应先作散点图,在具有线性相关关系的前数据,应先作散点图,在具有线性相关关系的前提下再求回归方程提下再求回归方程. .1: P92 练习练习1、22: P94 A组组 2、33:资料:资料作业布置作业布置