《实用回归分析.pptx》由会员分享,可在线阅读,更多相关《实用回归分析.pptx(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.1 变量间的相关关系第2章 回归分析概述统统计计分分析析的的目目的的:如何根据统计数据确定变量之间的关系形态及其关联程度,并探索出其内在的数量规律性.变量之间的关系变量之间的关系:确定性(函数关系)和非确定性(相关关系).确定性确定性:存在某种函数关系;相相关关关关系系:变量之间表现出某种不确定性,这种既有 关联、又不存在确定性的关系,称为相关关系.现代统计学关于统计(相关)关系的研究已经形成了两个重要的分支:相关分析相关分析和回归分析回归分析第1页/共35页2.1 变量间的相关关系第2章 回归分析概述l1.1.确定性关系确定性关系(函数关系函数关系)函函数数关关系系:能够用确定的函数关系
2、表达式表达变量之间的关系.严格的、确定的相互依存关系作为影响因素的变量称为自变量自变量;发生对应变化的变量称为因变量因变量可以用函数式表示 变量y与P个变量x1,x2,xp之间存在某种函数关系,可以表示为 y=f(x1,x2,xp)第2页/共35页2.1 变量间的相关关系第2章 回归分析概述l1.1.确定性关系确定性关系(函数关系函数关系)例:原材料消耗额 y 与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系 y=x1 x2 x3 商品的销售额 y 与销售量 x 之间的关系 y=px其中p为销售价格.第3页/共35页2.1 变量间的相关关系第2章 回归分析概述l2.2.相关关
3、系相关关系1 1)相相关关关关系系含含义义:是指变量之间具有密切关联,而又不能由某一个或某一些变量唯一确定另外一个变量的关系。数量关系不严格、不确定的依存关系用相关与回归分析方法去分析一般不能用函数式去准确表示例例:子女身高(y)与父母身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系商品的消费量(y)与居民收入(x)之间的关系第4页/共35页2.1 变量间的相关关系第2章 回归分析概述2)2)相相关关关关系系的的类类型型根根据据变变量量之之间间的的影影响响方方向向和和影影响响程程度,可以分为不同类型度,可以分为不同类型.按相关的按相关的方向方向分为:分为:正相关正相关,负相关负相
4、关按相关的按相关的程度程度分为:分为:完全相关完全相关变量之间的函数关系;变量之间的函数关系;不相关不相关现象之间彼此互不影响,其数量变化各自独立;现象之间彼此互不影响,其数量变化各自独立;不完全相关不完全相关界于前两者之间界于前两者之间(一般的相关关系指的都是不完一般的相关关系指的都是不完全相关全相关)按相关形式分为:线性相关线性相关变量之间近似表现为一条直线变量之间近似表现为一条直线非线性相关非线性相关变量之间近似表现为一条曲线研究变量的个数分为:单相关两个变量的相关关系复相关一个变量对两个或两个以上变量的相关关系偏相关研究多个变量之间的相关关系时,假设其他变量不变,只研究其中两个变量的相
5、关关系.第5页/共35页2.1 变量间的相关关系 变量间的关系变量间的关系变量间的关系变量间的关系变量关系确定性关系:相关关系 可用确定的函数表达式表达相关方向 正相关 负相关 相关程度 完全相关完全不相关 不完全相关 相关形式 线性相关 非线性相关 变量的个数:单相关/复相关/偏相关 第6页/共35页2.1 变量间的相关关系3.3.相关分析相关分析相关分析相关分析(Correlation Analysis)是根据实际观察的数据资料,在具有相关关系的变量之间,对现象之间的依存关系的表现形式和密切程度的研究,它处理的是一种相互关系。两种方法 散点图:相关系数:比较直观详细的定量分析之前,对变量之
6、间存在的相关关系的方向、形式和密切程度进行大致判断定量分析 第7页/共35页 不相关不相关不相关 负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关 2.1 变量间的相关关系散点图散点图反映变量之间相关关系的图形反映变量之间相关关系的图形以直角坐标系的横轴代表变量以直角坐标系的横轴代表变量X X,纵轴代表变量,纵轴代表变量Y Y,将两,将两个变量间相对应的变量值用坐标点的形式描绘出来个变量间相对应的变量值用坐标点的形式描绘出来第8页/共35页2.1 变量间的相关关系
7、3.3.相关分析相关分析相关分析相关分析(Correlation Analysis)相关系数相关系数(Correlation coefficient):又称Pearson 相关系数,是根据样本数据计算的对两个变量之间线性关系强弱的度量值,用r表示.若相关系数是根据总体全部数据计算出来的,则称为总体相关系数,记为第9页/共35页样本相关系数的计算公式 设(xi,yi)(i=1,2,n)是来自总体(X,Y)的样本,则样本相关系数的计算公式为:式中,第10页/共35页相关系数的意义:r无单位,-1r1 0r1表示两个变量间存在正线性相关关系。-1r0表示两个变量间存在负线性相关关系。r=0表示两个变
8、量间不存在线性相关关系。|r|=1表示两个变量间存在完全线性相关关系。|r|越接近于0,表示两变量间线性相关程度越低。|r|越接近于1,表示两变量间线性相关程度越高。第11页/共35页 不相关不相关不相关 负线性相关负线性相关负线性相关-1r 0-1r 0-1r 0 正线性相关正线性相关正线性相关0r10r10r1 非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关r=-1r=-1r=-1完全正线性相关完全正线性相关完全正线性相关r=1r=1r=1 相关系数的意义:第12页/共35页相关系数等级划分表相关系数等级划分表相关系数等级划分表相关系数等级划分表r的取值|r|0
9、.30.3|r|0.50.5|r|p样本容量的个数要多于解释变量的个数.第2章 回归分析概述第32页/共35页2.3 回归分析的主要内容及其一般模型线性回归模型是本书的重点线性回归模型是本书的重点线性回归模型是本书的重点线性回归模型是本书的重点 l1.线性回归应用最广泛;l2.只有在回归模型是线性的假设下,才能得到比较深入和一般的结果;l3.许多非线性的回归模型可以转化为线性回归问题.第2章 回归分析概述第33页/共35页2.3 回归分析的主要内容及其一般模型线性回归模型通常要研究的问题线性回归模型通常要研究的问题线性回归模型通常要研究的问题线性回归模型通常要研究的问题:l1.如何根据样本 ,求出 及方差 的估计;l2.对回归方程及回归系数的种种假设进行检验;l3.如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析.第2章 回归分析概述第34页/共35页感谢您的观看!第35页/共35页