《相关系数.ppt》由会员分享,可在线阅读,更多相关《相关系数.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、相关系数课件现在学习的是第1页,共26页1、两个变量的关系、两个变量的关系不相关不相关相关关相关关系系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系:相关关系:对于两个变量,当自变量取值一定时,对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的因变量的取值带有一定随机性的两个变量之间的关系。关系。复习回复习回顾顾现在学习的是第2页,共26页相关关系相关关系 给出两个变量,当一个变量一定时,另一给出两个变量,当一个变量一定时,另一个变量的取值具有一定的随机性个变量的取值具有一定的随机性1、注意与函数关系的区别、注意与函数关系的区别2、回归分析、回归分析散点
2、图散点图 将样本中的所有数据点(将样本中的所有数据点(xi,yi),描在平,描在平面直角坐标系中,以表示具有相关关系的两个变面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形量的一组数据的图形现在学习的是第3页,共26页2、最小二乘估计、最小二乘估计下的线性回归方程:下的线性回归方程:2)a,b 的意义是:以的意义是:以 a 为基数,为基数,x 每增加每增加1个单位,个单位,y相应地平均相应地平均增加增加 b 个单位个单位。1)称为样本点的中心称为样本点的中心。现在学习的是第4页,共26页(1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积,求求(3)(3)计算计算(
3、4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写出回归直线方程写出回归直线方程 3、求线性回归方程的步骤:、求线性回归方程的步骤:现在学习的是第5页,共26页4、回归分析的基本步骤回归分析的基本步骤:A.画散点画散点图图B.求回归方求回归方程程C.用回归直线方程解决应用问题用回归直线方程解决应用问题求线性回归方程的步骤:求线性回归方程的步骤:(1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积,求求(3)(3)计算计算(4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写,写出回归直线方程出回归直线方程 现在学习的是第
4、6页,共26页相关性相关性1、在散点图中,点有一个集中的大致趋势、在散点图中,点有一个集中的大致趋势2、在散点图中,所有的点都在一条直线附近、在散点图中,所有的点都在一条直线附近 波动线性相关。波动线性相关。xxxyyyOOO现在学习的是第7页,共26页问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?需要对需要对x,y的线性相关的线性相关性进行检验性进行检验现在学习的是第8页,共26页 从散点图上可
5、以看出,如果变量之间存在着某种关系,这些点会有一个从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的集中的大致趋势大致趋势,这种趋势通常可以用,这种趋势通常可以用一条光滑的曲线一条光滑的曲线来近似描述,这种近似的过程称来近似描述,这种近似的过程称为为曲线拟合曲线拟合。在两个变量。在两个变量x x和和y y的散点图中,所有点看上去都在一条直线附近波动,的散点图中,所有点看上去都在一条直线附近波动,则称变量间是则称变量间是线性相关线性相关的。此时,我们可以用一条直线来拟合,这条直线叫的。此时,我们可以用一条直线来拟合,这条直线叫回归直线回归直线。xyO现在学习的是第9页,共26页
6、思考:思考:观察散点图的大致趋势,人的年龄的与人体脂肪含量具观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?有什么相关关系?年龄与脂肪的散点图,从整体上看,它们是线性相关的年龄与脂肪的散点图,从整体上看,它们是线性相关的 现在学习的是第10页,共26页思考思考2 2:在上面的散点图中,这些点散布在从左下角到右上在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为角的区域,对于两个变量的这种相关关系,我们将它称为正相关正相关.一般地,如果两个变量成正相关,那么这两个变一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?量的变化趋势
7、如何?现在学习的是第11页,共26页思考思考3 3:如果两个变量成负相关,从整体上看这两个变量的变化如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?趋势如何?其散点图有什么特点?一个变量随另一个变量的变大而变小,散点图中的点散一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域布在从左上角到右下角的区域.这就像函数中的增函数和这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也从小到大,减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。或从大到小。思考思考4 4:你能列举一些生活中的变量成正相关或负相关的实你能列举一些生
8、活中的变量成正相关或负相关的实例吗例吗?年龄与身高是正相关,网速与下载文件所需时间是负相关。年龄与身高是正相关,网速与下载文件所需时间是负相关。现在学习的是第12页,共26页例例2.52.5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如下表:学生学生学科学科 ABCDE数学数学8075706560物理物理7066686462 画出散点图,并判断它们是否有相关关系画出散点图,并判断它们是否有相关关系.数学数学物理物理具有相关关系具有相关关系.现在学习的是第13页,共26页例例3.3.下表给出了某校下表给出了某校1212名高一学生的身高名高一学生的身高(单位:单位:cm)cm)和体和体重重
9、(单位:单位:kg)kg):画出散点图,并观察它们是否有相关关系画出散点图,并观察它们是否有相关关系.身身高高体体重重具有相关关系具有相关关系.现在学习的是第14页,共26页思考:如何分析变量之间是否具有相关的关系?思考:如何分析变量之间是否具有相关的关系?分析变量之间是否具有相关的关系,我们可以借助日常生分析变量之间是否具有相关的关系,我们可以借助日常生活和工作活和工作经验经验对一些常规问题来进行对一些常规问题来进行定性分析定性分析,如儿童的,如儿童的身高随着年龄的增长而增长,但它们之间又不存在一种确定身高随着年龄的增长而增长,但它们之间又不存在一种确定的函数关系,因此它们之间是一种非确定性
10、的随机关系,即的函数关系,因此它们之间是一种非确定性的随机关系,即相关关系。相关关系。散点图也只是形象地描述点的分布情况,它的散点图也只是形象地描述点的分布情况,它的“线性线性”是否明是否明显只能通过观察,显只能通过观察,但仅凭这种定性分析不够;但仅凭这种定性分析不够;要想把握其特征,必须要想把握其特征,必须进行进行定量定量的研究的研究现在学习的是第15页,共26页相关系数相关系数建构数学建构数学现在学习的是第16页,共26页现在学习的是第17页,共26页相关系数相关系数r的性质:的性质:(2);(3)越接近于越接近于1,x,y的线性相关的线性相关程度越强;程度越强;(4)越接近于越接近于0,
11、x,y的线性相关的线性相关程度越弱;程度越弱;(1)P7思考交流思考交流现在学习的是第18页,共26页1如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大()ECD A2 2、对对于散点于散点图图下列下列说说法中正确一个是(法中正确一个是()A.A.通通过过散点散点图图一定可以看出一定可以看出变变量之量之间间的的变变化化规规律律 B.B.通通过过散点散点图图一定不可以看出变量之间的变化规律一定不可以看出变量之间的变化规律 C.C.通过散点图可以看出正相关与负相关有明显区别通过散点图可以看出正相关与负相关有明显区别 D.D.通过散点图看不出正相关与负相关有什么区
12、别通过散点图看不出正相关与负相关有什么区别C现在学习的是第19页,共26页3现在学习的是第20页,共26页例例.下表是随机抽取的下表是随机抽取的8 8对母女的身高数据,试根据对母女的身高数据,试根据这些数据探讨这些数据探讨y y与与x x之间的关系之间的关系.母亲身高母亲身高x/cmx/cm154154157157 158158 159159 160160 161161 162162 163163女儿身高女儿身高y/cmy/cm155155156156 159159 162162 161161 164164 165165 166166解:画出散点图现在学习的是第21页,共26页列表:ixiyi
13、xi2yi2xiyi1154155237162402523870215715624649243362449231581592496425281251224159162252812624425758516016125600259212576061611642592126896264047162165262442722526730816316626569275562705812741288202944 207484205194现在学习的是第22页,共26页计算相关系数:因为r=0.963接近1,所以x与y具有较强的线性相关关系.现在学习的是第23页,共26页建立线性回归模型:y=a+bx现在学习的
14、是第24页,共26页小结1、相关关系的判断、相关关系的判断2、画散点图、画散点图3、线性关系系数、线性关系系数现在学习的是第25页,共26页例例1.下表给出我国从下表给出我国从1949至至1999年人口数据资料,试年人口数据资料,试根据表中数据估计我国根据表中数据估计我国2004年的人口数年的人口数.检验:检验:(1)作统计假设)作统计假设H0:x与与y不具有线性相关关系不具有线性相关关系;(2)由)由0.05与与n-2=9,在附录在附录1中查的中查的r0.05=0.602;(3)根据公式求的线性相关系数)根据公式求的线性相关系数r=0.998;(4)因为)因为|r|=0.9980.602,|r|=0.9980.602,即即|r|r|r|r0.050.05,所以,所以有有95%的把握的把握认为x与与y之之间具有具有线性相关关系,性相关关系,线性相关回性相关回归方程方程y=527.591+14.453x是有意是有意义的的.年份年份4954596469747984899499人口数人口数/百万百万5426036727058079099751035110711771246现在学习的是第26页,共26页