《变量之间的相关关系.ppt》由会员分享,可在线阅读,更多相关《变量之间的相关关系.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于变量之间的相关关系现在学习的是第1页,共35页小明小明,你数学成绩不太好你数学成绩不太好,物物理怎么样理怎么样?也不太好啊也不太好啊.学不好数学学不好数学,物理也物理也是学不好的是学不好的?.现在学习的是第2页,共35页你认为老师的说法对吗你认为老师的说法对吗?事实上事实上,我们在考察数学成绩对物理成绩影响的同时我们在考察数学成绩对物理成绩影响的同时,还必须还必须考虑到其他的因素考虑到其他的因素:爱好爱好,努力程度努力程度 如果单纯从数学对物理的影响来考虑如果单纯从数学对物理的影响来考虑,就是考虑这两者之间的就是考虑这两者之间的相关相关关系关系我们在生活中我们在生活中,碰到很多相关关系的问
2、题碰到很多相关关系的问题:数学数学成绩成绩学习学习兴趣兴趣花花费费时时间间其其他他因因素素现在学习的是第3页,共35页现在学习的是第4页,共35页知识探究(一):知识探究(一):变量之间的相关关系变量之间的相关关系思考思考1 1:考察下列问题中两个变量之间的关系:考察下列问题中两个变量之间的关系:(1 1)商品销售收入与广告支出经费;)商品销售收入与广告支出经费;(2 2)粮食产量与施肥量;)粮食产量与施肥量;(3 3)人体内的脂肪含量与年龄)人体内的脂肪含量与年龄. . 这些问题中两个变量之间的关系是函数关系吗这些问题中两个变量之间的关系是函数关系吗? 均不是!均不是!上述两个变量之间的关系
3、是一种非确定性上述两个变量之间的关系是一种非确定性关系,称之为关系,称之为相关关系相关关系,那么相关关系的,那么相关关系的含义如何?含义如何? 现在学习的是第5页,共35页自变量取值一定时,因变量的取值带有一定随机自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系性的两个变量之间的关系,叫做相关关系. .一、相关关系的概念一、相关关系的概念2 2、相关关系与函数关系的异同点、相关关系与函数关系的异同点不同点不同点:函数关系是一种确定的关系,因果关系;而相关关系:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系。是一种非确定性关系,也
4、可能是伴随关系。相同点相同点:均是指两个变量的关系:均是指两个变量的关系相关关系相关关系当自变量取值一定当自变量取值一定, ,因变量的取值带有一定的随机因变量的取值带有一定的随机性(性( 非确定性关系非确定性关系) )函数关系函数关系-函数关系指的是自变量和因变量之间的关系是相函数关系指的是自变量和因变量之间的关系是相互唯一确定的互唯一确定的. .1 1、对相关关系的理解、对相关关系的理解现在学习的是第6页,共35页1 1、下列两变量中具有相关关系的是(、下列两变量中具有相关关系的是( )A A、角度和它的余弦值、角度和它的余弦值 B B、正方形的边长和面积、正方形的边长和面积C C、成人的身
5、高和视力、成人的身高和视力 D D 、身高和体重、身高和体重练习:练习:D现在学习的是第7页,共35页 在现实生活中存在着大量的相关关系,如何在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要判断和描述相关关系,统计学发挥着非常重要的作用,变量之间的相关关系带有不确定性,的作用,变量之间的相关关系带有不确定性,这需要通过大量的数据,对数据进行统计分析这需要通过大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断。,发现规律,才能作出科学的判断。 对具有相关关系的两个变量进行统计分析的对具有相关关系的两个变量进行统计分析的方法叫方法叫回归分析回归分析 相关关系
6、是进行回归分析的基础,同时,相关关系是进行回归分析的基础,同时,也是散点图的基础。也是散点图的基础。现在学习的是第8页,共35页知识探究(二):散点图知识探究(二):散点图 【问题问题】在一次对人体脂肪含量和年龄关系在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:的研究中,研究人员获得了一组样本数据: 其中各年龄对应的脂肪数据是这个年龄人群其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数脂肪含量的样本平均数. .年龄年龄 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527
7、.5 26.326.3 28.228.2年龄年龄 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6现在学习的是第9页,共35页思考思考1 1:对某一个人来说,他的体内脂肪含量不一定随年龄对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性能表现出一定的规律性. .观察上表中的数据,大体上看,随着年观察上表中的数据,大体上看,随着年龄的增加,人体
8、脂肪含量怎样变化?龄的增加,人体脂肪含量怎样变化?年龄年龄 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年龄年龄 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6思考思考2 2:为了确定年龄和人体脂肪含量之间的更明确的关系为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间
9、,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象的关系有一个直观的印象. .以以x x轴表示年龄,轴表示年龄,y y轴表示脂肪含量轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?你能在直角坐标系中描出样本数据对应的图形吗? 现在学习的是第10页,共35页在平面直角坐标系中,表示具有相关关系的两个在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为变量的一组数据图形,称为散点图散点图. . 散点图散点图:用来判断两个变量是否具有相关关系用来判断两个变量是否具有相关关系. .现在学习的是第11页,共35页思考思考3 3:观察散点图的大致趋势,人的
10、年龄与人体观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?脂肪含量具有什么相关关系? 在上面的散点图中,这些点散布在从左下角到右上角在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称的区域,对于两个变量的这种相关关系,我们将它称为为正相关正相关. .一般地,如果两个变量成正相关,那么这两一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?个变量的变化趋势如何? 现在学习的是第12页,共35页思考思考4 4:如果两个变量成负相关,从整体上如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图看这两个变量的变化趋势如何?其
11、散点图有什么特点?有什么特点? 思考思考5 5:你能列举一些生活中的变量成正相你能列举一些生活中的变量成正相关或负相关的实例吗关或负相关的实例吗? ? 正相关的特点:正相关的特点:一个变量随另一个变量的变大而变一个变量随另一个变量的变大而变大,散点图中的点散布在大,散点图中的点散布在从左下角到右上角从左下角到右上角的区域的区域负相关的特点:负相关的特点:一个变量随另一个变量的变大而变一个变量随另一个变量的变大而变小,散点图中的点散布在从小,散点图中的点散布在从左上角到右下角左上角到右下角的区域的区域现在学习的是第13页,共35页 如高原含氧量与海拔高度的相关关系,海平如高原含氧量与海拔高度的相
12、关关系,海平面以上,海拔高度越高,含氧量越少。作出散面以上,海拔高度越高,含氧量越少。作出散点图发现,它们点图发现,它们散散布在从左上角到右下布在从左上角到右下角的区域内角的区域内,称它们称它们成成负相关负相关.现在学习的是第14页,共35页例例1 1 以下是某地搜集到的新房屋的销售以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:价格和房屋的面积的数据:房屋面积房屋面积(平方米)(平方米) 616170701151151101108080135135105105销售价格销售价格(万元)(万元) 12.212.215.315.324.824.821.621.618.418.429.229.
13、22222画出数据对应的散点图,并指出销售价画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是格与房屋面积这两个变量是正相关还是负相关负相关. . 现在学习的是第15页,共35页售价随房屋面积的变大而增加,散点图中的点散布在售价随房屋面积的变大而增加,散点图中的点散布在从左下角到右上角的区域从左下角到右上角的区域. .现在学习的是第16页,共35页一、选择题(每题一、选择题(每题5 5分,共分,共1515分)分)1.1.下列关系中为相关关系的有下列关系中为相关关系的有( )( )学生的学习态度和学习成绩之间的关系;学生的学习态度和学习成绩之间的关系;教师的执教水平与学生的学习
14、成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系学生的身高与学生的学习成绩之间的关系; ;某个人的年龄与本人的知识水平之间的关系某个人的年龄与本人的知识水平之间的关系. .(A)(A)(B)(B)(C)(C)(D)(D)【解析解析】选选A.A.据相关性的定义可知为相关关系,无相关关据相关性的定义可知为相关关系,无相关关系系. .巩固练习巩固练习现在学习的是第17页,共35页现在学习的是第18页,共35页二、填空题(每题二、填空题(每题5 5分,共分,共1010分)分)3.3.(20102010广东高考)某市居民广东高考)某市居民2005200520
15、092009年家庭平均收入年家庭平均收入x x(单位:万元)与年平均支出(单位:万元)与年平均支出y y(单位:万元)的统计资料(单位:万元)的统计资料如表所示:如表所示:根据统计资料,居民家庭年平均收入的中位数是根据统计资料,居民家庭年平均收入的中位数是 _,家庭年平均,家庭年平均收入与年平均支出有收入与年平均支出有 _的线性相关关系的线性相关关系. .(填(填“正相关正相关”、“负负相关相关”)13 13 正相关正相关13正相关正相关现在学习的是第19页,共35页三、解答题(三、解答题(6 6题题1212分,分,7 7题题1313分,共分,共2525分)分)4.4.某品牌服装的广告费支出某
16、品牌服装的广告费支出x x(单位:万元)与销售额(单位:万元)与销售额y y(单位:万元(单位:万元)之间有如下的对应数据:)之间有如下的对应数据:试画出散点图,并判断广告费试画出散点图,并判断广告费x x与销售额与销售额y y是否具有线性相关关系是否具有线性相关关系. .现在学习的是第20页,共35页【解析解析】根据题中数据画出散点图如下:根据题中数据画出散点图如下:观察散点图,可以发现观察散点图,可以发现5 5个样本点从整体上看大致在一条直线附近,所个样本点从整体上看大致在一条直线附近,所以变量以变量x x、y y之间具有线性相关关系之间具有线性相关关系. .现在学习的是第21页,共35页
17、思考:当人的年龄增加时,体内脂肪含量到思考:当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?底是以什么方式增加的呢?0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065 这些点大致分布在这些点大致分布在一条直线附近一条直线附近, 像这样如像这样如果散点图中的点果散点图中的点的的分布分布从整体上看大致在一从整体上看大致在一条直线附近我们就称条直线附近我们就称这两个变量之间具有这两个变量之间具有线性相关线性相关关系关系, 这条直线这条直线叫做叫做回归直线回归直线, 这条直这条直线的方程叫做线的方程叫做回归方程回归方程现在学习的是第22页,
18、共35页0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065现在学习的是第23页,共35页 人们经过长期的实践与研究人们经过长期的实践与研究,已经找到了计算已经找到了计算回归方程回归方程的较为科学的方法的较为科学的方法: 0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065现在学习的是第24页,共35页xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)()(1221121 人们经过长期的实践与研究人们经过长期的实践与研究,已经找到了计已经找到了计算回归方程算回归方程的较为
19、科学的方法的较为科学的方法: 以上公式的推导较复杂,故不作推导,这一以上公式的推导较复杂,故不作推导,这一方法叫方法叫最小二乘法最小二乘法。 回归方程为回归方程为ybx a 现在学习的是第25页,共35页例例1、有一个同学家开了一个小卖部,他为了研究气温对有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:气温的对比表:摄氏温摄氏温度度-504712 15 19 23 27 31 36热饮杯数15615013212813011610489 93 76 54二、求线性回归方程二、求线
20、性回归方程现在学习的是第26页,共35页1、从散点图中发现气温与热饮销售杯从散点图中发现气温与热饮销售杯数之间关系的一般规律;数之间关系的一般规律;2、求回归方程;、求回归方程;(已知:(已知: )3、如果某天的气温是、如果某天的气温是2摄氏度,预摄氏度,预测这天卖出的热饮杯数。测这天卖出的热饮杯数。摄氏温摄氏温度度-504712 15 19 23 27 31 36热饮杯数15615013212813011610489 93 76 54020406080100120140160180-10 -50510152025303540热饮杯数热饮杯数xy15.364,111.636xy11112114
21、335,14778iiiiixx y现在学习的是第27页,共35页解:解:1、各点散布在从左上角到由下角的区域里,因此,、各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。出去的热饮杯数越少。2、回归方程为:、回归方程为:2.352147.767yx 3、当、当x=2时,时, 因此,某天的气温为因此,某天的气温为2摄氏度时,这天大约可以卖出摄氏度时,这天大约可以卖出143杯热饮。杯热饮。 143.063y现在学习的是第28页,共35页小结小结1.1.求样本数据的线性回归方程,可按下列求样本数
22、据的线性回归方程,可按下列步骤进行:步骤进行:第一步,列表计算平均数第一步,列表计算平均数 , xy1niiix y21niix第二步,求和第二步,求和 , 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 第四步,写出回归方程第四步,写出回归方程 现在学习的是第29页,共35页例例2:观察两相关变量得如下表:观察两相关变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程求两变量间的回归方程解解1:列表:列表:i12345678910-1-2-3-4-553421-9-
23、7-5-3-1153799141512551512149xiyixiyi计算得计算得:0, 0yx110,1101011012yxxiiiii1010110010110101010122101iiiiixxyxyxb000bxbya现在学习的是第30页,共35页练习:练习:实验测得四组(实验测得四组(x,y)的值如下表所示)的值如下表所示:x1234y2345则则y与与x之间的回归直线方程为(之间的回归直线方程为( ).1Ayx.2Byx.21Cyx.1Dyx442112.5,3.5,30,40iiiiixyxx yA现在学习的是第31页,共35页总结提升总结提升:基础知识框图表解基础知识框图
24、表解变量间关系变量间关系函数关系函数关系相关关系相关关系 散点图散点图线性线性相关相关线性回归方程线性回归方程现在学习的是第32页,共35页课堂检测:课堂检测:1、(、(09.宁夏海南理)对变量宁夏海南理)对变量x,y观测数据(观测数据(xi,yi)(i=1,2,.,10),得散点图得散点图1;对变量;对变量u,v有观测数据有观测数据(ui,vi)(i=1,2,.,10),得散点图得散点图2,由这两个散点,由这两个散点图可判断(图可判断( )yxovou图1图2A、变量、变量x与与y 正相关,正相关,u与与v正相关;正相关;B、变量、变量x与与y 正相关,正相关,u与与v负相关;负相关;C、变量、变量x与与y 负相关,负相关,u与与v正相关;正相关;D、变量、变量x与与y 负相关,负相关,u与与v负相关;负相关;C现在学习的是第33页,共35页2、已知变量、已知变量x与变量与变量y有下列对应数据:有下列对应数据:x1234y0.51.523则则y对对x的回归直线方程为的回归直线方程为现在学习的是第34页,共35页感谢大家观看现在学习的是第35页,共35页