《统计学原理相关分析.ppt》由会员分享,可在线阅读,更多相关《统计学原理相关分析.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、MASDDMASDD相关分析相关分析统计学原理统计学原理第七章第七章 相关分析相关分析学习要点学习要点:本章详细讲述了相关分析的概念、相关关系本章详细讲述了相关分析的概念、相关关系的测定、回归方程的建立和应用等内容。通过本章的的测定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。量进行相关分析。11、相关的意义和种类相关的意义和种类22、相关图表和相关系数相关图表和相关系数33、回归分析回归分析11、相关
2、的意义和种类、相关的意义和种类一、相关分析的意义:一、相关分析的意义:1 1、统计分析的重要课题:、统计分析的重要课题:2 2、在总体中,如果对变量、在总体中,如果对变量x x的每一个数值,相应还有第的每一个数值,相应还有第二个变量二个变量y y的数值,则各对变量的变量值所组成的总体的数值,则各对变量的变量值所组成的总体称为称为二元总体二元总体;由二个以上相互对应的变量组成的总;由二个以上相互对应的变量组成的总体,称为体,称为多元总体多元总体。3 3、对二元总体应了解的问题、对二元总体应了解的问题v两变量是不是存在关系,关系的密切程度如何两变量是不是存在关系,关系的密切程度如何v如果存在关系,
3、那么关系的具体形式是什么如果存在关系,那么关系的具体形式是什么v怎样根据一个变量的变动来估计另一变量的变动怎样根据一个变量的变动来估计另一变量的变动二、相关分析的概念二、相关分析的概念1 1、相关分析相关分析就是对总体中确实具有联系的标志进行分析,就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。其主体是对总体中具有因果关系标志的分析。2 2、现象总体的依存关系类型:、现象总体的依存关系类型:v因素标志是决定结果标志发展的条件,根据因素标志是决定结果标志发展的条件,根据结果标志结果标志对因素标志的不同反应对因素标志的不同反应,可分两种类型。,可分两种类型。v函数关
4、系函数关系是当因素标志的数量确定之后,结果标志的是当因素标志的数量确定之后,结果标志的数量也随之完全确定,以数量也随之完全确定,以y=f(x)y=f(x)表现表现v相关关系相关关系是不完全确定的随机关系。因素标志的数值,是不完全确定的随机关系。因素标志的数值,可能有若干结果标志的数值。可能有若干结果标志的数值。3 3、函数关系与相关关系的联系、函数关系与相关关系的联系对具有相关关系的现象进行分析时,则必须利用响应的对具有相关关系的现象进行分析时,则必须利用响应的函数关系数学表达式,来表明现象之间的相关方程式。函数关系数学表达式,来表明现象之间的相关方程式。相关关系是相关分析的研究对象,函数关系
5、是相关分析相关关系是相关分析的研究对象,函数关系是相关分析的工具。的工具。例:例:圆的面积与半径的关系;计件工资总额与零件数量;圆的面积与半径的关系;计件工资总额与零件数量;看书时间和学习成绩。看书时间和学习成绩。三、相关的种类三、相关的种类1 1、按相关的程度分为、按相关的程度分为完全相关、不完全相关和不相关。完全相关、不完全相关和不相关。v两种依存关系的标志,其中一个标志的数量变化由另两种依存关系的标志,其中一个标志的数量变化由另一个标志的数量变化所确定,则称一个标志的数量变化所确定,则称完全相关,也称函完全相关,也称函数关系。数关系。v两个标志彼此互不影响,其数量变化各自独立,称为两个标
6、志彼此互不影响,其数量变化各自独立,称为不相关不相关。v两个现象之间的关系,介乎完全相关与不相关之间称两个现象之间的关系,介乎完全相关与不相关之间称不完全相关不完全相关。2 2、按相关的方向分为正相关和负相关、按相关的方向分为正相关和负相关v正相关正相关指相关关系表现为因素标志和结果标志的数量指相关关系表现为因素标志和结果标志的数量变动方向一致。变动方向一致。v负相关负相关指相关关系表现为因素标志和结果标志的数量指相关关系表现为因素标志和结果标志的数量变动方向是相反的。变动方向是相反的。3 3、按相关的形式分为、按相关的形式分为线性相关和非线性相关线性相关和非线性相关v一种现象的一个数值和另一
7、现象相应的数值在指教坐一种现象的一个数值和另一现象相应的数值在指教坐标系中确定为一个点,称为线性相关。标系中确定为一个点,称为线性相关。4 4、按影响因素的多少分为、按影响因素的多少分为单相关和复相关单相关和复相关。v如果研究的是如果研究的是一个一个结果标志同某一因素标志相关,就结果标志同某一因素标志相关,就称单相关。称单相关。v如果分析如果分析若干若干因素标志对结果标志的影响,称为复相因素标志对结果标志的影响,称为复相关或多元相关。关或多元相关。四、相关分析的主要内容四、相关分析的主要内容1 1、确定相关关系的存在,相关关系呈现的形态确定相关关系的存在,相关关系呈现的形态和方向,和方向,相关
8、关系的密切程度(主要方法是绘制相关图表和计相关关系的密切程度(主要方法是绘制相关图表和计算相关系数)算相关系数)2 2、确定相关关系的、确定相关关系的数学表达式数学表达式3 3、确定因变量、确定因变量估计值误差的程度。估计值误差的程度。22、相关图表和相关系数、相关图表和相关系数一、相关表的编制一、相关表的编制1 1、编制相关表前首先要通过实际调查取得一系列成对的、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。标志值资料作为相关分析的原始数据。2 2、相关表的分类:、相关表的分类:v简单相关表简单相关表是资料未经分组的相关表,它是把因素标是资料未经分组的相关表
9、,它是把因素标志值按照从小到大的顺序并配合结果标志值一一对应志值按照从小到大的顺序并配合结果标志值一一对应而平行排列起来的统计表。而平行排列起来的统计表。v分组相关表分组相关表是在简单相关表的基础上,将原始数据进是在简单相关表的基础上,将原始数据进行分组而编成的统计表。行分组而编成的统计表。、单变量分组相关表、单变量分组相关表自变量分组并计算次数,而对应的因变量不分组,只计自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。算其平均值。单变量分组相关表的特点:使冗长的资料简化,能够更单变量分组相关表的特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。清晰地反映出两变量之间相
10、关关系。、双变量分组相关表:双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。似棋盘,故又称棋盘式相关表。二、相关图的编制二、相关图的编制1 1、相关图:相关图:利用直角坐标系第一象限,把自变量置于横利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况值用坐标点形式描绘出来,用以表明相关点分布状况的图形。的图形。2 2、相关图被形象地称为、相关图被形象地称为相关散点图相关散点图3
11、3、因素标志分了组,结果标志表现为组平均数,所绘制、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫的相关图就是一条折线,这种折线又叫相关曲线。相关曲线。三、相关系数的计算三、相关系数的计算:1 1、符号系数、符号系数:把两个同平均值的离差数列做对称比较。:把两个同平均值的离差数列做对称比较。v如果一个数列的离差与另一个数列的离差有很多同号,如果一个数列的离差与另一个数列的离差有很多同号,就可以认为这两标志之间存在正相关。就可以认为这两标志之间存在正相关。如果大多数为异号,就可以认为他们之间存在负相关。如果大多数为异号,就可以认为他们之间存在负相关。如果同号与异
12、号大体一样,显然不存在相关。如果同号与异号大体一样,显然不存在相关。v符号系数符号系数K K分析分析、K=1K=1时时,标志间的相关是,标志间的相关是负相关负相关、K=+1K=+1时,标志间的相关是时,标志间的相关是正相关正相关、K=0K=0 时,时,标志间标志间不存在相关不存在相关v例:例:v符号系数的优点在于意义明了,计算方便,其缺点在符号系数的优点在于意义明了,计算方便,其缺点在于掩盖了离差绝对值上的不同,指标只能反映相关的于掩盖了离差绝对值上的不同,指标只能反映相关的一般趋势。一般趋势。2 2、相关系数(着重研究线性的单相关系数)、相关系数(着重研究线性的单相关系数)v定义:是按积差方
13、法计算,同样以两变量与各自平均定义:是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。间相关程度。v公式:公式:协方差的意义协方差的意义、显示显示x x与与y y是正相关还是负相关是正相关还是负相关协方差为负,是负相关,协方差为负,是负相关,协方差为正,是正相关。协方差为正,是正相关。、协方差显示协方差显示x x与与y y相关程度的大小相关程度的大小当相关点在四个象限呈散乱的分布,相关程度很低当相关点在四个象限呈散乱的分布,相关程度很低当相关点分布在当相关点分布在x x与与y y的平均值线上时,表示不
14、相关的平均值线上时,表示不相关当相关点靠近一直线,表示相关关系密切当相关点靠近一直线,表示相关关系密切当相关点全部落在一直线,表示完全相关当相关点全部落在一直线,表示完全相关相关系数相关系数r r的性质的性质:、当、当 时,时,x x与与y y为完全线性相关,它们之间存在为完全线性相关,它们之间存在确定的函数关系。确定的函数关系。、当、当 时,表示时,表示x x与与y y存在着一定的线性相关,存在着一定的线性相关,r r的绝对值越大,越接近于的绝对值越大,越接近于1 1,表示,表示x x与与y y直线相关程度直线相关程度越高,反之越低。越高,反之越低。相关系数的相关系数的r r的推导公式的推导
15、公式:33、回归分析、回归分析一、回归分析的意义:一、回归分析的意义:1 1、回归分析回归分析就是对具有相关关系的两个或两个以上变量就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确立一个相应的之间数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个一直量来推测另一个未知量,数学表达式,以便从一个一直量来推测另一个未知量,为估算预测提供一个重要的方法。为估算预测提供一个重要的方法。2 2、回归分析和相关分析是互相补充、密切联系回归分析和相关分析是互相补充、密切联系的,相关的,相关分析需要回归分析来表明现象数量关系的具体形式,分析需要回归分析来表明现象数量关系的
16、具体形式,而回归分析则应该建立在相关分析的基础上。而回归分析则应该建立在相关分析的基础上。3 3、回归的种类、回归的种类v按自变量的个数分:按自变量的个数分:一元回归一元回归:只有一个自变量,又称简单回归:只有一个自变量,又称简单回归多元回归多元回归:有两个或两个以上自变量,又称复回归:有两个或两个以上自变量,又称复回归v按回归线的形状分:按回归线的形状分:线性回归线性回归直线回归直线回归非线性回归非线性回归曲线回归曲线回归二、简单线性回归方程:二、简单线性回归方程:1 1、简单线性方程式:简单线性方程式:y=a+bxy=a+bx2 2、变量、变量y y不仅受不仅受x x的影响,还受其他随机因
17、素的影响,因此的影响,还受其他随机因素的影响,因此通过相关图,可以直观地发现各个相关点并不都落在一条通过相关图,可以直观地发现各个相关点并不都落在一条直线上,而是在直线上下波动,只呈现线性相关的趋势。直线上,而是在直线上下波动,只呈现线性相关的趋势。3 3、我们试图在相关图的散点中引出一条模拟的回归直线,、我们试图在相关图的散点中引出一条模拟的回归直线,以表明两变量以表明两变量x x与与y y的关系,称为估计回归线,的关系,称为估计回归线,回归方程:回归方程:y yc c=a+bx=a+bxycyycy的估计值的估计值 a a纵轴截距纵轴截距 bb回归系数回归系数,代表自变量增加一个单位时因变
18、量的平均增加代表自变量增加一个单位时因变量的平均增加值。值。4 4、计算、计算a a、b b值值当实际值当实际值y y与估计值与估计值ycyc的离差平方和为最小值时,则此直的离差平方和为最小值时,则此直线为最优的理想直线。线为最优的理想直线。即:即:当出现权数时:当出现权数时:5 5、回归系数、回归系数b b与相关系数与相关系数r r的关系的关系6、回归分析和相关分析的特点:回归分析和相关分析的特点:v回归分析是研究两变量之间的因果关系,所以必须通过定性回归分析是研究两变量之间的因果关系,所以必须通过定性分析来确定哪个是自变量,哪个是因变量。分析来确定哪个是自变量,哪个是因变量。v回归分析是研
19、究两变量具有因果关系的数学形式回归分析是研究两变量具有因果关系的数学形式v回归分析中回归系数有回归分析中回归系数有2 2个(区分自变量、因变量)个(区分自变量、因变量)相关分析中相关系数有相关分析中相关系数有1 1个(不区分自变量、因变量)个(不区分自变量、因变量)v对于回归方程进行预测估计时,只能根据对于回归方程进行预测估计时,只能根据x x估计估计y yc c,不能根据,不能根据y yc c估计估计x x三、估计标准误三、估计标准误1 1、当、当ycyc(估计值)与(估计值)与y y(实际值)有偏差的时候,产生(实际值)有偏差的时候,产生估计值代表性问题。估计值代表性问题。2 2、估计标准
20、误是用来说明回归方程代表性大小的统计分、估计标准误是用来说明回归方程代表性大小的统计分析指标,计算公式为析指标,计算公式为四、估计标准误与相关系数的关系四、估计标准误与相关系数的关系1、2 2、估计误差最小为、估计误差最小为0 0,即,即y-yy-yc c=0=0,所有,所有y y点落在点落在y yc c线上,线上,Y Y与与x x为完全的相关关系。(函数关系)为完全的相关关系。(函数关系)估计误差最大为总误差,即估计误差最大为总误差,即y yc c-=0,y-=0,yc c与与 重重合,合,y y与与x x不相关。不相关。往届往届试题根据根据5位同学西方位同学西方经济学的学学的学习时间和考和考试成成绩计算算得出如下得出如下资料:料:N=5,x=40,y=310,x2=370,y2=20700,xy=2740要求:要求:编制以学制以学习时间为自自变量的直量的直线回回归方程方程计算学算学习时间和学和学习成成绩直接的相关系数,并解直接的相关系数,并解释相关的密切程度和方向(相关的密切程度和方向(15分)分)