p第12章 相关与回归分析.ppt

上传人:qwe****56 文档编号:69508034 上传时间:2023-01-05 格式:PPT 页数:61 大小:1.29MB
返回 下载 相关 举报
p第12章 相关与回归分析.ppt_第1页
第1页 / 共61页
p第12章 相关与回归分析.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《p第12章 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《p第12章 相关与回归分析.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学原理统计学原理第十二章 相关分析1第一节第一节 相关分析的意义和任务相关分析的意义和任务一、相关关系的概念一、相关关系的概念在社会经济现象中,变量之间的关系大致在社会经济现象中,变量之间的关系大致可分为两种,函数关系和相关关系。可分为两种,函数关系和相关关系。21.1.函数关系函数关系 变量之间以一定的函数形式形成的一一对变量之间以一定的函数形式形成的一一对应关系称为函数关系。在具有相互依存关系的应关系称为函数关系。在具有相互依存关系的两个变量之中,作为根据的变量叫做自变量,两个变量之中,作为根据的变量叫做自变量,x x来表示,发生对应变化的变量叫做因变量,来表示,发生对应变化的变量叫做

2、因变量,用用y y表示。例如,设表示。例如,设y y为出租汽车费用,为出租汽车费用,x x为行为行驶里程,驶里程,y y与与x x之间的关系,可以表达为:之间的关系,可以表达为:Y=5Y=51.2x1.2x式中:式中:5 5是出租汽车的固定服务费用,是出租汽车的固定服务费用,1.21.2是每是每公里的出租费用。公里的出租费用。当当x=2x=2时,所应支付的费用为时,所应支付的费用为y=7.4y=7.4元。元。在研究过程中,保持一定数值的量叫做常数。在研究过程中,保持一定数值的量叫做常数。32.2.相关关系相关关系两个变量之间,存在某种依存关系,但,变两个变量之间,存在某种依存关系,但,变量量y

3、并不是由变量并不是由变量x唯一确定的,它们之间没唯一确定的,它们之间没有严格的一一对应关系。两个变量之间的这有严格的一一对应关系。两个变量之间的这种关系称为相关关系。种关系称为相关关系。例如,身体高的人,一般讲体重也要重一些;例如,身体高的人,一般讲体重也要重一些;商品价格降低时,一般讲销售量会增加。这商品价格降低时,一般讲销售量会增加。这里,身高与体重,商品价格与销售量之间的里,身高与体重,商品价格与销售量之间的关系不是函数关系,而是相关关系。关系不是函数关系,而是相关关系。特点:现象之间数量依存关系的具体关系值特点:现象之间数量依存关系的具体关系值不是固定的。例如,身高不是固定的。例如,身

4、高180m的人,可以表的人,可以表现为许多个体重值。现为许多个体重值。4二、相关关系的种类二、相关关系的种类1.按照相关关系涉及的变量(或因素)的多少可以分按照相关关系涉及的变量(或因素)的多少可以分为单相关和复相关为单相关和复相关单相关:两个因素之间的相关关系叫做单相关。单相关:两个因素之间的相关关系叫做单相关。如:施肥量与亩产量如:施肥量与亩产量复相关:三个或三个以上因素之间的相关关系叫做复相关:三个或三个以上因素之间的相关关系叫做复相关。复相关。如:同时研究种子、施肥量、降雨量与亩产量。如:同时研究种子、施肥量、降雨量与亩产量。我们这里,只讲单相关,而不讲复相关。我们这里,只讲单相关,而

5、不讲复相关。5二、相关关系的种类二、相关关系的种类2.按照变量之间相互关系的表现形式不同,可分按照变量之间相互关系的表现形式不同,可分为直线相关和非直线相关为直线相关和非直线相关直线相关(也称线性相关)直线相关(也称线性相关)当相关关系的一个变量变动时,另一个变量也当相关关系的一个变量变动时,另一个变量也相应地发生大致均等的变动,这种相关关系称为相应地发生大致均等的变动,这种相关关系称为线性相关。线性相关。非线性相关(也称曲线相关)非线性相关(也称曲线相关)当相关关系的一个变量变动时,另一个变量也当相关关系的一个变量变动时,另一个变量也相应地发生变动,但这种变动是不均等的,这种相应地发生变动,

6、但这种变动是不均等的,这种相关关系称为非直线相关。相关关系称为非直线相关。这里,只讲直线相关,而不讲曲线相关。这里,只讲直线相关,而不讲曲线相关。6二、相关关系的种类二、相关关系的种类3.按照变量之间相互关系的方向不同,可分为正相关和负相关按照变量之间相互关系的方向不同,可分为正相关和负相关正相关:当自变量正相关:当自变量x值增加,因变量值增加,因变量y值也随之相应地增加,这值也随之相应地增加,这样的相关关系就是正相关。例如,身高增加,体重也增加。样的相关关系就是正相关。例如,身高增加,体重也增加。负相关:当自变量负相关:当自变量x的值增加时,因变量的值增加时,因变量y的值相应减少,或者的值相

7、应减少,或者自变量数值减少时,因变量数值相应增加,这样的相关关系就是自变量数值减少时,因变量数值相应增加,这样的相关关系就是负相关。负相关。例如,商品价格降低,产品销售量增多。例如,商品价格降低,产品销售量增多。7三、相关分析的目的和内容三、相关分析的目的和内容相关分析是研究一个变量与另一个变量之相关分析是研究一个变量与另一个变量之间相关关系密切程度和相关方向的一种统间相关关系密切程度和相关方向的一种统计分析方法。计分析方法。目的:帮助我们对因素之间的关系密切目的:帮助我们对因素之间的关系密切程度和变化的规律性有一个具体的数量上程度和变化的规律性有一个具体的数量上的认识,用于进行各种推算和预测

8、。的认识,用于进行各种推算和预测。8主要内容:主要内容:1.绘制相关图。相关图能帮助我们做一般性绘制相关图。相关图能帮助我们做一般性判断,即通过相关图,确定现象之间有无判断,即通过相关图,确定现象之间有无关系,确定相关关系的表现形式。关系,确定相关关系的表现形式。2.计算相关系数。相关系数能从数量上明计算相关系数。相关系数能从数量上明确说明关系的密切程度和方向。确说明关系的密切程度和方向。3.测定两个因素之间的一般的关系值。这测定两个因素之间的一般的关系值。这需要用回归方程来解决。需要用回归方程来解决。4.计算估计标准误差。测定因变量估计值计算估计标准误差。测定因变量估计值和实际值之间的差异用

9、来反映因变量估计和实际值之间的差异用来反映因变量估计值的可靠性。值的可靠性。9第二节第二节 线性相关分析线性相关分析一、相关关系的一般性判断一、相关关系的一般性判断要分析说明现象之间相关关系,首先要判断了解要分析说明现象之间相关关系,首先要判断了解现象之间有没有关系,有什么样的关系。现象之间有没有关系,有什么样的关系。进行这种判断一般有两种方法:进行这种判断一般有两种方法:从定性分析进行一般判断从定性分析进行一般判断 现象之间有没有关系,有什么样的关系,这是现象之间有没有关系,有什么样的关系,这是一种质的规定性。对于这种质的规定性的认识属一种质的规定性。对于这种质的规定性的认识属于定性认识。从

10、认识的一般顺序来讲,只有在定于定性认识。从认识的一般顺序来讲,只有在定性判断的基础上才能够进行定量的分析和判断。性判断的基础上才能够进行定量的分析和判断。定性认识,来自于研究者的理论知识,专业知识,定性认识,来自于研究者的理论知识,专业知识,实际经验和研究能力。实际经验和研究能力。10用编制相关表或画相关图的方法来帮助判断。用编制相关表或画相关图的方法来帮助判断。1112二、相关系数二、相关系数 相关表和相关图只能大体上反映现象相关表和相关图只能大体上反映现象之间的相关关系,不能准确推断其相关的之间的相关关系,不能准确推断其相关的密切程度如何。要判断现象之间相关关系密切程度如何。要判断现象之间

11、相关关系的密切程度,需要计算相关系数。的密切程度,需要计算相关系数。相关系数的意义相关系数的意义相关系数是测定二个变量之间线性相相关系数是测定二个变量之间线性相关密切程度和方向的统计分析指标,用关密切程度和方向的统计分析指标,用表示。表示。13相关系数的基本公式:相关系数的基本公式:14相关系数的基本公式:相关系数的基本公式:15三、相关系数值的意义:三、相关系数值的意义:16判断标准:判断标准:17四、相关系数的计算四、相关系数的计算18相关系数的简捷计算法相关系数的简捷计算法积差法相关系数在计算过程中要使用两个积差法相关系数在计算过程中要使用两个数列的平均数,这样在计算上会发生一些数列的平

12、均数,这样在计算上会发生一些麻烦,我们可以利用简化公式计算相关系麻烦,我们可以利用简化公式计算相关系数。这个简化公式和后面将要讲到的回归数。这个简化公式和后面将要讲到的回归直线可以使用同一张计算表。这是用得比直线可以使用同一张计算表。这是用得比较多的一种计算公式。较多的一种计算公式。191.1.未分组资料未分组资料 202.2.分组资料分组资料 21五、相关系数的显著性检验五、相关系数的显著性检验r值值是未知总体的相关系数是未知总体的相关系数(=0,1)的一个样本估计值,即一系列类似抽样(或观的一个样本估计值,即一系列类似抽样(或观测)的样本值测)的样本值r1,r2,r3,中的一个数值,这中的

13、一个数值,这许多许多r值的次数分布,可作为检验值的次数分布,可作为检验r值显著性的值显著性的依据。依据。在小样本(在小样本(n30)情况下,通常采用)情况下,通常采用t分布分布来检验来检验r 的显著性。的显著性。其方法和步骤如下:其方法和步骤如下:22五、相关系数的显著性检验五、相关系数的显著性检验第一步:提出假设。第一步:提出假设。H0 :=0 H1 :0第二步:计算检验的统计量。第二步:计算检验的统计量。第三步:进行决策。第三步:进行决策。接受域接受域否定域否定域否定域否定域23例:例:1010名工人的智商值和劳动生产率的数据列表名工人的智商值和劳动生产率的数据列表7-6 7-6(P435

14、P435),),计算得出智商值与劳动生产率之间的相关系数计算得出智商值与劳动生产率之间的相关系数 r=0.867r=0.867。试对试对 r r 进行显著性检验。进行显著性检验。解:第一步:提出假设。解:第一步:提出假设。H0 :=0 ;H1 :0 第二步:计算检验的统计量。第二步:计算检验的统计量。第三步:进行决策。第三步:进行决策。24作业作业P367-三、计算题三、计算题 13 题。题。25相关系数的计算公式相关系数的计算公式 26二、相关程度的判断标准:二、相关程度的判断标准:27三、相关系数的显著性检验三、相关系数的显著性检验第一步:提出假设。第一步:提出假设。H0 :=0 H1 :

15、0第二步:计算检验的统计量。第二步:计算检验的统计量。第三步:进行决策。第三步:进行决策。接受域接受域否定域否定域否定域否定域28第三节第三节 一元线性回归分析一元线性回归分析一、概念一、概念 相关系数可以用来说明在直线相关条件下,两相关系数可以用来说明在直线相关条件下,两个现象相关关系的方向和程度,是有关系还是没个现象相关关系的方向和程度,是有关系还是没关系,关系密切还是不密切。但它不能说明一个关系,关系密切还是不密切。但它不能说明一个现象发生一定量的变化,另一个现象一般地会发现象发生一定量的变化,另一个现象一般地会发生多大的变化。相关系数不能说明两个变量之间生多大的变化。相关系数不能说明两

16、个变量之间的一般关系值。为了测定现象之间数量变化的一的一般关系值。为了测定现象之间数量变化的一般关系要使用数学方法。这种数学方法总称为回般关系要使用数学方法。这种数学方法总称为回归分析。归分析。所谓模型,简单地说,即是一些数学方程式。如所谓模型,简单地说,即是一些数学方程式。如果两个变量之间存在相关关系,并且一个变量的果两个变量之间存在相关关系,并且一个变量的变化会引起另一个变量按某一种线性关系变化,变化会引起另一个变量按某一种线性关系变化,则两个变量之间的关系可以用一元线性回归模型则两个变量之间的关系可以用一元线性回归模型表述。表述。29一元线性回归模型的一般形式为:一元线性回归模型的一般形

17、式为:30 下面,根据表下面,根据表7-67-6的资料,说明建立一元线性回归模型的原理和方法。的资料,说明建立一元线性回归模型的原理和方法。31根据表中资料,画出相关图。32二、一元线性回归模型的求解二、一元线性回归模型的求解33343536三、判定系数三、判定系数 r2判定系数判定系数r2是测定回归直线拟合优度的一个重要指标。是测定回归直线拟合优度的一个重要指标。37三、判定系数三、判定系数 r2判定系数判定系数r2是测定回归直线拟合优度的一个重要指标。是测定回归直线拟合优度的一个重要指标。38四、估计标准误差四、估计标准误差(一)概念(一)概念 根据对根据对x的回归直线方程,可用的回归直线

18、方程,可用x的值去估计的值去估计y的值。但是,推算出来的因变量的数值不是精确的值。但是,推算出来的因变量的数值不是精确的数值,它是一个估计值,和实际值有出入。因的数值,它是一个估计值,和实际值有出入。因此,建立了回归方程后,还需进一步测定估计值此,建立了回归方程后,还需进一步测定估计值的可靠性,即计算估计标准误差。的可靠性,即计算估计标准误差。估计标准误差就是用来说明回归方程推算结果估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。直线代表性大小的统计分析指标。39作用:作用:1.说明以回归

19、直线为中心的所有相关点的离说明以回归直线为中心的所有相关点的离散程度。估计标准误差大,则说明相关点散程度。估计标准误差大,则说明相关点与回归直线的离散程度大,反之,则说明与回归直线的离散程度大,反之,则说明离散程度小。离散程度小。2.说明回归直线的代表性大小,估计标准误说明回归直线的代表性大小,估计标准误差大,则回归直线的代表性小,估计标准差大,则回归直线的代表性小,估计标准误差小,则回归直线的代表性大。误差小,则回归直线的代表性大。3.能表示出变量能表示出变量y 诸观测值与的绝对离差数。诸观测值与的绝对离差数。40(二)计算方法(二)计算方法4142五、线性回归方程的显著性检验五、线性回归方

20、程的显著性检验第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。H0 :=0 (总体回归系数)总体回归系数)H1 :0第二步:计算回归系数第二步:计算回归系数b的检验统计量的检验统计量t值。值。第三步:进行决策。第三步:进行决策。对回归系数对回归系数b的检验就是要验证变量的检验就是要验证变量x与与y之间是否真正存在线之间是否真正存在线性关系。一般采用性关系。一般采用t检验,其步骤如下:检验,其步骤如下:43五、线性回归方程的显著性检验五、线性回归方程的显著性检验第一步:提出假设。假设观测的样本是从一个没有线性

21、关系的总体中选出的。第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第二步:计算回归系数第二步:计算回归系数b的检验统计量的检验统计量t值。值。第三步:进行决策。第三步:进行决策。接受域接受域否定域否定域否定域否定域44472 2、相关系数、相关系数r r的的显显著性著性检验检验 第一步:提出假第一步:提出假设设。H H0 0 :=0=0;H H1 1 :0 0 第二步:计算检验的统计量。第二步:计算检验的统计量。484950(5)线性回归方程的显著性检验)线性回归方程的显著性检验第一步:提出假设。第一步:提出假设。H0:=0;H1 :0第二步:计算回归系数第二步:计算回归

22、系数b的检验统计量的检验统计量t值。值。第三步:进行决策第三步:进行决策52根据表中资料,画出相关图。53作业作业P3684、5、6、7、8、954复习:一、相关系数的计算公式复习:一、相关系数的计算公式 55二、相关程度的判断标准:二、相关程度的判断标准:56三、相关系数的显著性检验三、相关系数的显著性检验第一步:提出假设。第一步:提出假设。H0 :=0 H1 :0第二步:计算检验的统计量。第二步:计算检验的统计量。第三步:进行决策。第三步:进行决策。接受域接受域否定域否定域否定域否定域57四、一元线性回归模型的一般形式为:四、一元线性回归模型的一般形式为:58五、估计标准误差的计算五、估计

23、标准误差的计算59六、线性回归方程的显著性检验六、线性回归方程的显著性检验第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。H0 :=0 (总体回归系数)总体回归系数)H1 :0第二步:计算回归系数第二步:计算回归系数b的检验统计量的检验统计量t值。值。第三步:进行决策。第三步:进行决策。60六、线性回归方程的显著性检验六、线性回归方程的显著性检验第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第二步:计算回归系数第二步:计算回归系数b的检验统计量的检验统计量t值。值。第三步:进行决策。第三步:进行决策。接受域接受域否定域否定域否定域否定域61

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁