《变量间的相互关系精选PPT.ppt》由会员分享,可在线阅读,更多相关《变量间的相互关系精选PPT.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变量间的相互关系第1页,此课件共36页哦一、变量之间的相关关系一、变量之间的相关关系 变量与变量之间的关系常见的有两类:一变量与变量之间的关系常见的有两类:一类是类是确定性的函数关系确定性的函数关系,像正方形的边长,像正方形的边长a和面积和面积S的关系,另一类是变量间的关系,另一类是变量间确实存在关系确实存在关系,但又不具备函数关系所要求的确定性,它们但又不具备函数关系所要求的确定性,它们的关系是带有的关系是带有随机性随机性的。的。人的身高并不能确定体重,但一般来说人的身高并不能确定体重,但一般来说“身高者,体也重身高者,体也重”,因此身高与体重这两个,因此身高与体重这两个变量具有变量具有相关
2、关系相关关系.第2页,此课件共36页哦 自变量取值一定时,因变量的取值带有一自变量取值一定时,因变量的取值带有一定定随机性随机性的两个变量之间的关系叫的两个变量之间的关系叫相关关相关关系系。怎样判断两个变量有没有相关关系怎样判断两个变量有没有相关关系设某地设某地10户家庭的年收入和年饮食支出的户家庭的年收入和年饮食支出的统计资料如下表统计资料如下表:(单位:万元单位:万元)年收入年收入24466677810饮食支出饮食支出0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3第3页,此课件共36页哦 由表中数据可以看出,由表中数据可以看出,y有随有随x增加而增增加而增加
3、的趋势,并且增加的趋势变缓。加的趋势,并且增加的趋势变缓。为了更清楚地看出为了更清楚地看出x与与y是否有相关关系,是否有相关关系,我们以年收入我们以年收入x的取值为横坐标,把年饮的取值为横坐标,把年饮食支出食支出y的相应取值作为纵坐标,在直角的相应取值作为纵坐标,在直角坐标系中描点。这样的图形叫做坐标系中描点。这样的图形叫做散点图散点图。第4页,此课件共36页哦xy从这个散点图发现:从这个散点图发现:家庭年收入和年饮食支出之间具家庭年收入和年饮食支出之间具有相关关系。并且当年收入的值由小变大时,年饮食支有相关关系。并且当年收入的值由小变大时,年饮食支出的值也在由小变大。出的值也在由小变大。点的
4、位置散布在从左下角到右点的位置散布在从左下角到右上角的区域。称它们成上角的区域。称它们成正相关正相关。第5页,此课件共36页哦 如果一个变量的值由小变大时,另一个变量的如果一个变量的值由小变大时,另一个变量的值由大变小,值由大变小,它们的点散布在从左上角到右下角的区它们的点散布在从左上角到右下角的区域内。域内。这种相关称作这种相关称作负相关负相关。如下图所示:如下图所示:如高原含氧量与海拔高度如高原含氧量与海拔高度的相关关系,海平面以上,的相关关系,海平面以上,海拔高度越高,含氧量越少。海拔高度越高,含氧量越少。作出散点图发现,它们散作出散点图发现,它们散布在从左上角到右下角的区布在从左上角到
5、右下角的区域内。又如汽车的载重和汽域内。又如汽车的载重和汽车每消耗车每消耗1升汽油所行使的升汽油所行使的平均路程,称它们成平均路程,称它们成负相关负相关.O第6页,此课件共36页哦相关关系与函数关系的异同点相关关系与函数关系的异同点(1)相同点:两者均是指两个变量的关系)相同点:两者均是指两个变量的关系;(2)不同点:函数关系是一种)不同点:函数关系是一种确定的关系确定的关系,如如匀速直线运动中时间匀速直线运动中时间t与路程与路程s的关系;的关系;相关关系是一种相关关系是一种非确定的关系非确定的关系,如一块农田,如一块农田的水稻产量与施肥量之间的关系,事实上,函的水稻产量与施肥量之间的关系,事
6、实上,函数关系是两个非随机变量的关系,而相关关系数关系是两个非随机变量的关系,而相关关系是是非随机变量与随机变量非随机变量与随机变量的关系。的关系。第7页,此课件共36页哦下列两个变量之间的关系,哪个不是相关关系下列两个变量之间的关系,哪个不是相关关系A A、粮食的产量与施肥量、粮食的产量与施肥量B B、商品的销售收入和广告支出经费、商品的销售收入和广告支出经费C C、人的年龄和身高、人的年龄和身高 D D、正方形的边长和面积、正方形的边长和面积E E、作文水平和课外阅读量、作文水平和课外阅读量F F、降雪量和交通事故的发生率、降雪量和交通事故的发生率第8页,此课件共36页哦具有相关关系不具有
7、相关关系第9页,此课件共36页哦如何分析变量之间是否具有相关的关系如何分析变量之间是否具有相关的关系 分析变量之间是否具有相关的关系,可以借助分析变量之间是否具有相关的关系,可以借助日常生活和工作日常生活和工作经验经验对一些常规问题来进行对一些常规问题来进行定定性分析性分析,如儿童的身高随着年龄的增长而增,如儿童的身高随着年龄的增长而增长,但它们之间又不存在一种确定的函数关长,但它们之间又不存在一种确定的函数关系,因此它们之间是一种非确定性的随机关系,因此它们之间是一种非确定性的随机关系,即相关关系。但仅凭这种定性分析不够;系,即相关关系。但仅凭这种定性分析不够;第10页,此课件共36页哦 一
8、来定性分析有时会给我们以一来定性分析有时会给我们以误导误导;二来定性二来定性分析无法确定变量之间相互影响的分析无法确定变量之间相互影响的程度有多大程度有多大。因些,我们还需要进行因些,我们还需要进行定量分析定量分析。如何进行如何进行定量分析定量分析呢?由于变量间的相关呢?由于变量间的相关关系是一种随机关系,因此,我们只能关系是一种随机关系,因此,我们只能借助统借助统计计这一工具来解决问题,也就是通过收集大量这一工具来解决问题,也就是通过收集大量数据,在对数据进行统计分析的基础上,发现数据,在对数据进行统计分析的基础上,发现其中的规律,并对它们之间的关系作出推断。其中的规律,并对它们之间的关系作
9、出推断。第11页,此课件共36页哦 从散点图上可以看出,如果变量之间存在从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个着某种关系,这些点会有一个集中的大致趋集中的大致趋势势,这种趋势通常可以用,这种趋势通常可以用一条光滑的曲线一条光滑的曲线来来近似描述,这种近似的过程称为近似描述,这种近似的过程称为曲线拟合曲线拟合。在两个变量在两个变量x和和y的散点图中,所有点看上去的散点图中,所有点看上去都在一条直线附近波动,则称变量间是都在一条直线附近波动,则称变量间是线线性相关性相关的。此时,我们可以用一条直线来拟的。此时,我们可以用一条直线来拟合(如图),这条直线叫合(如图),这条直线
10、叫回归直线回归直线。第12页,此课件共36页哦探究探究:.年龄脂肪239.52717.83921.24125.9454927.5 26.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6如上的一组数据,你能分析人体的脂肪含量与年龄如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?之间有怎样的关系吗?第13页,此课件共36页哦 从上表发现,对某个人不一定有此规律,但对很多个体放从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出在一起,就体现出“人体脂肪随年龄增长而增加人体脂肪随年龄增长而增加”这一规这一规律律
11、.而表中各年龄对应的脂肪数是这个年龄人群的样本平均数而表中各年龄对应的脂肪数是这个年龄人群的样本平均数.我们也可以对它们作统计图、表,对这两个变量有一个直观我们也可以对它们作统计图、表,对这两个变量有一个直观上的印象和判断上的印象和判断.下面我们以年龄为横轴,下面我们以年龄为横轴,脂肪含量为纵轴建立直脂肪含量为纵轴建立直角坐标系,作出各个点,角坐标系,作出各个点,称该图为称该图为散点图散点图。如图:O20253035404550556065年龄脂肪含量510152025303540第14页,此课件共36页哦 我们再观察它的图像发现这些点大致分布在一条直线附我们再观察它的图像发现这些点大致分布在
12、一条直线附近近,像这样,如果散点图中点的分布从整体上看大致在一条直线像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系附近,我们就称这两个变量之间具有线性相关关系,这条直线叫这条直线叫做做回归直线回归直线,该直线叫,该直线叫回归直线方程。回归直线方程。20253035404550 556065年龄脂肪含量0510152025303540第15页,此课件共36页哦最小二乘法最小二乘法:为最小的方法.2求利用配方法求得:第16页,此课件共36页哦用方程 来表示.在一般统计书中习惯用b表示一次项系数,用a表示常数项,这正好与我们表示的一次函数习惯相反.第
13、17页,此课件共36页哦第18页,此课件共36页哦例例1:观察两相关变量得如下表:观察两相关变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程求两变量间的回归方程解:解:列表:列表:i12345678910-1-2-3-4-553421-9-7-5-3-1153799141512551512149计算得计算得:第19页,此课件共36页哦所求回归直线方程为所求回归直线方程为 y=x小结:求线性回归直线方程的步骤:小结:求线性回归直线方程的步骤:第一步:列表第一步:列表 ;第二步:计算第二步:计算 ;第三步:代入公式计算第三步:代入公式计算b,a的值
14、;的值;第四步:写出直线方程。第四步:写出直线方程。第20页,此课件共36页哦例例2:有一个同学家开了一个小卖部,他为了研究气温对热饮:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:的对比表:摄氏温度摄氏温度 -5 0 4 7 12 15 19 23 27 31 36热饮杯数热饮杯数 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一从散点图中发现气温与热饮销售杯数之间
15、关系的一 般规律;般规律;(3)求回归方程;求回归方程;(4)如果某天的气温是如果某天的气温是 C,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。第21页,此课件共36页哦解解:(1)散点图散点图(2)气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,即气温越高,卖出去的热饮杯数越少。卖出去的热饮杯数越少。温度温度热饮杯数热饮杯数第22页,此课件共36页哦(3)从散点图可以看出,这些点大致分布在从散点图可以看出,这些点大致分布在一条直线附近。一条直线附近。第23页,此课件共36页哦y=-2.352x+147.767(4)当)当x=2时,时,y=143.063,因此,这天大因此,这天大
16、约可以卖出约可以卖出143杯热饮。杯热饮。(3)=-2.352=143.767第24页,此课件共36页哦练习题练习题1下列说法正确的是(下列说法正确的是()(A)y=2x2+1中的中的x,y是具有相关关系的两个是具有相关关系的两个变量变量 (B)正四面体的体积与其棱长具有相关关系)正四面体的体积与其棱长具有相关关系 (C)电脑的销售量与电脑的价格之间是一种)电脑的销售量与电脑的价格之间是一种确定性的关系确定性的关系 (D)传染病医院感染)传染病医院感染“非典非典”的医务人员数的医务人员数与医院收治的与医院收治的“非典非典”病人数是具有相关关系病人数是具有相关关系的两个变量的两个变量D第25页,
17、此课件共36页哦2.有关线性回归的说法,不正确的是有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间回归直线最能代表线性相关的两个变量之间的关系的关系D.任一组数据都有回归方程任一组数据都有回归方程D第26页,此课件共36页哦3.下面哪些变量是相关关系下面哪些变量是相关关系()A.出租车费与行驶的里程出租车费与行驶的里程 B.房屋面积与房屋价格房屋面积与房屋价格 C.身高与体重身高与体重 D.铁的大小与质量铁的大小与质量C第27页,此课件
18、共36页哦4.回归方程回归方程y=1.5x15,则,则()A.y=1.5 x15 B.15是回归系数是回归系数a C.1.5是回归系数是回归系数a D.x=10时,时,y=0A第28页,此课件共36页哦5.线性回归方程线性回归方程y=bx+a过定点过定点_.(x,y)第29页,此课件共36页哦6.下表是某地的年降雨量与年平均气温,判断下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗两者是相关关系吗?求回归直线方程有意义吗?年平均气温年平均气温(C)12.5112.8412.8413.6913.3312.7413.05年降雨量年降雨量(mm)748542507813
19、574701432由散点图看出,由散点图看出,求回归直线方程求回归直线方程无实际意义。无实际意义。第30页,此课件共36页哦7.某市近某市近10年的煤气消耗量与使用煤气户数年的煤气消耗量与使用煤气户数的历史资料如下:的历史资料如下:年年 份份1993199419951996199719981999200020012002x用用户户(万(万户户)11.21.61.822.53.244.24.5y(百万立(百万立方米)方米)679.81212.114.5202425.427.5(1)求回归方程;)求回归方程;(2)若市政府下一步再扩大)若市政府下一步再扩大5千煤气用户,千煤气用户,试预测该市煤气消
20、耗量将达到多少试预测该市煤气消耗量将达到多少.第31页,此课件共36页哦解:(解:(1)画散点图并求回归方程)画散点图并求回归方程y=6.0573x+0.0811(2)当)当x=5时时,y=30.367630.37。第32页,此课件共36页哦 1、现实生活中存在许多相关关系:商品销售与、现实生活中存在许多相关关系:商品销售与广告、粮食生产与施肥量、人体的脂肪量与年广告、粮食生产与施肥量、人体的脂肪量与年龄等等的相关关系龄等等的相关关系.2、通过收集大量的数据,进行统计,对数据分析,、通过收集大量的数据,进行统计,对数据分析,找出其中的规律,对其相关关系作出一定判断找出其中的规律,对其相关关系作
21、出一定判断.3、由于变量之间相关关系的广泛性和不确定性,、由于变量之间相关关系的广泛性和不确定性,所以样本数据应较大,才有代表性所以样本数据应较大,才有代表性.才能对它们之才能对它们之间的关系作出正确的判断间的关系作出正确的判断.小结小结第33页,此课件共36页哦4 4对于两个变量之间的关系,有函数关系和相对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确定性关系,关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系相关关系是一种非确定性关系.6.6.一般情况下两个变量之间的相关关系成正一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性相关
22、或负相关,类似于函数的单调性.5 5散点图能直观反映两个相关变量之间的散点图能直观反映两个相关变量之间的大致变化趋势,利用计算机作散点图是简大致变化趋势,利用计算机作散点图是简单可行的办法单可行的办法.第34页,此课件共36页哦3.3.求样本数据的线性回归方程,可按下求样本数据的线性回归方程,可按下列步骤进行:列步骤进行:第一步,计算平均数第一步,计算平均数 ,第二步,求和第二步,求和 ,第三步,计算第三步,计算 第四步,写出回归方程第四步,写出回归方程 第35页,此课件共36页哦7.7.回归方程被样本数据惟一确定,各样本点大回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近致分布在回
23、归直线附近.对同一个总体,不同对同一个总体,不同的样本数据对应不同的回归直线,所以回归直的样本数据对应不同的回归直线,所以回归直线也具有随机性线也具有随机性.8.8.对于任意一组样本数据,利用上述公式都可对于任意一组样本数据,利用上述公式都可以求得以求得“回归方程回归方程”,如果这组数据不具有线,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的性相关关系,即不存在回归直线,那么所得的“回归方程回归方程”是没有实际意义的是没有实际意义的.因此,对一组样因此,对一组样本数据,应先作散点图,在具有线性相关关系的前本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程提下再求回归方程.第36页,此课件共36页哦