相关性分析课件.ppt

上传人:石*** 文档编号:87132371 上传时间:2023-04-16 格式:PPT 页数:44 大小:2.21MB
返回 下载 相关 举报
相关性分析课件.ppt_第1页
第1页 / 共44页
相关性分析课件.ppt_第2页
第2页 / 共44页
点击查看更多>>
资源描述

《相关性分析课件.ppt》由会员分享,可在线阅读,更多相关《相关性分析课件.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于相关性分析现在学习的是第1页,共44页一、相关分析的意义一、相关分析的意义二、相关关系的测定二、相关关系的测定6.16.1相关分析概述相关分析概述现在学习的是第2页,共44页 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关)(非确定性关)比较下面两种现象间的依存关系比较下面两种现象间的依存关系现在学习的是第3页,共44页现象间的依存关系大致可以分成两种类型:现象间的

2、依存关系大致可以分成两种类型:函数关系函数关系指现象间所具有的严格的确定性的指现象间所具有的严格的确定性的依存关系依存关系相关关系相关关系指客观现象间确实存在关系,但数指客观现象间确实存在关系,但数量上不是严格对应的依存关系量上不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:有函数关系有函数关系的变量间,由于有测量误差及各种随机因素的干扰,的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻可表现为相关关系;对具有相关关系的变量有深

3、刻了解之后,相关关系有可能转化为或借助函数关系了解之后,相关关系有可能转化为或借助函数关系来描述。来描述。相关关系的概念相关关系的概念现在学习的是第4页,共44页现象之间的相互联系,常表现为一定的因果关系现象之间的相互联系,常表现为一定的因果关系,将这些现象数量化则成为变量:,将这些现象数量化则成为变量:其中一个或若其中一个或若干个起着影响作用的变量称为干个起着影响作用的变量称为自变量自变量,通常用,通常用X表表示,它是引起另一现象变化的原因,是可以控制示,它是引起另一现象变化的原因,是可以控制、给定的值;、给定的值;而受自变量影响的变量称为而受自变量影响的变量称为因变量因变量,通常用,通常用

4、Y表示,它是自变量变化的结果,是不确定表示,它是自变量变化的结果,是不确定的值。的值。相关关系的概念相关关系的概念现在学习的是第5页,共44页如果研究如果研究工业生产规模对工业贷款额的需求量工业生产规模对工业贷款额的需求量问题,问题,工业产值是自变量,工业贷款就是因变量;工业产值是自变量,工业贷款就是因变量;如果研究如果研究贷款量对工业生产规模的影响贷款量对工业生产规模的影响情况,工业情况,工业贷款额是自变量,工业产值是因变量。贷款额是自变量,工业产值是因变量。研究居民收入水平与储蓄存款余额的关系研究居民收入水平与储蓄存款余额的关系居民收入水平是自变量,储蓄存款余额是因变量。有时相关关系表现的

5、因果关系不明显,要根据研究目有时相关关系表现的因果关系不明显,要根据研究目的来确定。的来确定。工业产值与工业贷款额的关系工业产值与工业贷款额的关系例如例如现在学习的是第6页,共44页按涉及变量的多少分为按涉及变量的多少分为相相关关关关系系的的种种类类按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关相关关系的种类相关关系的种类现在学习的是第7页,共44页相关分析的内容相关分析的内容对现象之间相互关系的方向和程度进行分析。相关分析相关分析主要内容主要内容确定现象之间是否存在相关关

6、系以及相关关系的表现形式。确定相关关系的密切程度。确定相关关系的数学表达式,即回归方程式。检验估计值的误差。现在学习的是第8页,共44页一、相关分析的意义一、相关分析的意义二、相关关系的测定二、相关关系的测定6.16.1相关分析概述相关分析概述现在学习的是第9页,共44页定性分析定性分析 是依据研究者的理论知识和实践经验,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以对客观现象之间是否存在相关关系,以及何种关系作出判断及何种关系作出判断定量分析定量分析 在定性分析的基础上,通过编制在定性分析的基础上,通过编制相关相关表表、绘制、绘制相关图相关图、计算、计算相关系数相关系数

7、与与判判定系数定系数等方法,来判断现象之间相关的等方法,来判断现象之间相关的方向、形态及密切程度方向、形态及密切程度相关关系的测定相关关系的测定现在学习的是第10页,共44页简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数较适用于所观察的样本单位数较多标志变异又较复杂,需要分多标志变异又较复杂,需要分组的情况组的情况将现象之间的相互关系,用将现象之间的相互关系,用表格的形式来反映。表格的形式来反映。相关表相关表现在学习的是第11页,共44页正正 相相 关关负负 相相 关关曲曲 线相关线相

8、关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分用坐标点的形式描绘出来,用以表明相关点分布状况的图形。布状况的图形。相关图相关图现在学习的是第12页,共44页在在直线相关直线相关的条件下,用以反映的条件下,用以反映两变量两变量间间线性线性相关相关密切程度的统计指标,用密切程度的统计指标,用r表示表示相关系数相关系数 现在学习的是第13页,共44页相关系数相关系数r r的取值范围:的取值范围:-1r1-1r1

9、r0 为为正相关,正相关,r 0 为负相关;为负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关;相关;0|r|1表示存在表示存在不同程度线性相关:不同程度线性相关:|r|0.3为不存在线性相关为不存在线性相关 0.3|r|0.5 为低度线性相关;为低度线性相关;0.5|r|0.8为显著线性相关;为显著线性相关;|r|0.8为高度线性相关。为高度线性相关。现在学习的是第14页,共44页是相关系数的平方,用是相关系数的平方,用 表表示;用来衡量回归方程对示;用来衡量回归方程对y y的的解释程度。解释程度。判定系数取值范围:判定系数取值范围:越接近于

10、越接近于1 1,表明,表明x x与与y y之间之间的相关性越强;的相关性越强;越接近于越接近于0 0,表明两个变量之间几乎没有直,表明两个变量之间几乎没有直线相关关系线相关关系.判定系数判定系数现在学习的是第15页,共44页【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数 资料资料结论:结论:工业总产值与能源消耗量之间存在高工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量度的正相关关系,能源消耗量x的变化能够解的变化能够解释工业总产值释工业总产值y变化的变化的95.2。现在学习的是第16页,共44页第第六六章章 相关与回归分

11、析相关与回归分析6.16.1相关分析概述相关分析概述6.26.2一元线性回归分析一元线性回归分析现在学习的是第17页,共44页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差6.26.2一元线性回归分析一元线性回归分析现在学习的是第18页,共44页回归分析回归分析指在相关分析的基础上,根指在相关分析的基础上,根据相关关系的数量表达式据相关关系的数量表达式(回归方程式)与给定的(回归方程式)与给定的自自变量变量x x,揭示,揭示因变量因变量y y在数量上在数量上的平均变化,并求得因变量的的平均变化,并求得因变量的预测值的统计分析方法预测

12、值的统计分析方法回归:退回回归:退回regression现在学习的是第19页,共44页回归分析与相关分析回归分析与相关分析q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回归越无相关就无回归,相关程度越高,回归越好;好;q 相关系数和回归系数方向一致,可以互相关系数和回归系数方向一致,可以互相推算。相推算。联系:联系:现在学习的是第20页,共44页q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要确要确定自变量和因变量;定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析中只均为随机变量,回归分析中只有有y为随机变量;为随机变

13、量;q相关分析测定相关程度和方向,回归分析用回相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。归模型进行预测和控制。回归分析与相关分析回归分析与相关分析区别:区别:现在学习的是第21页,共44页回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分现在学习的是第22页,共44页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差6.26.2一元线性回

14、归分析一元线性回归分析现在学习的是第23页,共44页一元线性回归模型一元线性回归模型对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回归模型为:,构造一元线性回归模型为:假定假定E()=0,总体一元线性回归方程,总体一元线性回归方程:现在学习的是第24页,共44页一元线性回归方程的几何意义一元线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0现在学习的是第25页,共44页总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数以

15、样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各种的影响时,其它各种因素对因变量因素对因变量y的平均影响;的平均影响;回归系数回归系数b 表明自表明自变量变量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动b个单个单位。位。(估计的回归方程估计的回归方程)(一元线性回归方程)(一元线性回归方程)现在学习的是第26页,共44页随机干扰:随机干扰:各种偶然各种偶然因素、观察误差和其因素、观察误差和其他被忽视因素的影响他被忽视因素的影响X对对y的线性影响而形成的线性影响而形成的系统部分,反映两变的系统部分,反

16、映两变量的平均变动关系,即量的平均变动关系,即本质特征。本质特征。现在学习的是第27页,共44页一元线性回归方程一元线性回归方程中参数中参数a、b的确定:的确定:最小平方法最小平方法基本数学要求:基本数学要求:现在学习的是第28页,共44页整理得到由两个关于整理得到由两个关于a、b的二元一次方的二元一次方程组成的方程组:程组成的方程组:进一步整理,有:进一步整理,有:现在学习的是第29页,共44页【分析分析】因为工业总产值与能源消耗量之间存因为工业总产值与能源消耗量之间存在高度正相关关系(在高度正相关关系(),),所以可以拟合工业总产值对能源消耗量的线性所以可以拟合工业总产值对能源消耗量的线性

17、回归方程。回归方程。【例例】建立工业总产值对能源消耗量的线建立工业总产值对能源消耗量的线性回归方程性回归方程 资料资料解:设解:设线性回归方程为线性回归方程为现在学习的是第30页,共44页即线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,能源消耗量计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加每增加一个单位(十万吨),工业总产值将增加0.79610.7961个单位(亿元)。个单位(亿元)。现在学习的是第31页,共44页回归系数回归系数b与相关系数与相关系数r的关系:的关系:r0 r0 r=0b0 b0 b=0现在学习的是第32页,共44页一

18、、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归方程的拟合优度与评价三、回归方程的拟合优度与评价6.26.2一元线性回归分析一元线性回归分析现在学习的是第33页,共44页离差平方和的分解离差平方和的分解每个因变量每个因变量y y的实际值与其平均数之的实际值与其平均数之间存在的总离差(间存在的总离差(y-y-)的平方和称)的平方和称为总离差平方和,简称总变差。为总离差平方和,简称总变差。总变差总变差回归变差回归变差估计值估计值 与平均数与平均数 离差的平方和,离差的平方和,称为回归变差(可解释变差)。称为回归变差(可解释变差)。剩余变差剩余变差每个观察值每个观察值y

19、与估计值与估计值 的离差平的离差平方和,称为剩余变差(未解释变差。方和,称为剩余变差(未解释变差。现在学习的是第34页,共44页剩余平方和剩余平方和回归回归平方和平方和总离差平方和总离差平方和现在学习的是第35页,共44页Lyy=U+Q总离差平方和总离差平方和回归平方和回归平方和剩余(误差)平方和剩余(误差)平方和现在学习的是第36页,共44页判定系数判定系数是指因变量的总变差中可以被自变量解是指因变量的总变差中可以被自变量解释部分的比例,即可解释因素的影响程释部分的比例,即可解释因素的影响程度。用来说明因变量的变化有多少可通度。用来说明因变量的变化有多少可通过自变量得到解释。是衡量拟合模型优

20、过自变量得到解释。是衡量拟合模型优劣的重要分析指标。劣的重要分析指标。r2值越大,说明回归值越大,说明回归模型拟合得愈优。模型拟合得愈优。现在学习的是第37页,共44页判定系数与相关系数的关系判定系数与相关系数的关系二者均可测定两变量的二者均可测定两变量的线性相关密切程度线性相关密切程度现在学习的是第38页,共44页判定系数与相关系数的区别:判定系数与相关系数的区别:q判定系数判定系数无方向性(不能反映负相关),无方向性(不能反映负相关),相关系数相关系数则有方向,其方向与样本回归系则有方向,其方向与样本回归系数数 b 相同(可反映正相关,也可反映负相关);相同(可反映正相关,也可反映负相关)

21、;q判定系数判定系数说明变量值的总离差平方和中可说明变量值的总离差平方和中可以用回归线来解释的比例,以用回归线来解释的比例,相关系数相关系数只说明只说明两变量间关联程度及方向。两变量间关联程度及方向。现在学习的是第39页,共44页估计标准误差估计标准误差是因变量各实际值与其估计值之间的平均是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准越强,用回归方程估计或预测的结果越准确。可从一方面反映回归模型拟合的优劣确。可从一方面反映回归

22、模型拟合的优劣状况。状况。现在学习的是第40页,共44页在大样本条件下,可用公式计算:在大样本条件下,可用公式计算:【例例】计算前面拟合的工业总产值对能源消耗计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差量回归方程的回归标准差 资料资料现在学习的是第41页,共44页估计标准差越小,则变量间相关程度越估计标准差越小,则变量间相关程度越高,回归线对高,回归线对Y的解释程度越高。的解释程度越高。判定系数与估计标准误差的关系:判定系数与估计标准误差的关系:现在学习的是第42页,共44页序号序号能源消耗量(十能源消耗量(十万吨)万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234

23、567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计9166255508626175 37887返回首页现在学习的是第43页,共44页感感谢谢大大家家观观看看现在学习的是第44页,共44页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁