《统计学课件第八章 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《统计学课件第八章 相关与回归分析.ppt(96页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统统 计计 学学 概概 论论中南大学中南大学 统统 计计 学学 概概 论论 内内 容容第一章第一章 统计总论统计总论第二章第二章 统计调查统计调查第三章第三章 统计数据的整理与显示统计数据的整理与显示第四章第四章 统计指标统计指标第五章第五章 统计指数统计指数第六章第六章 时间序列分析时间序列分析第七章第七章 抽样推断抽样推断第八章第八章 相关与回归分析相关与回归分析第九章第九章 统计预测统计预测第十章第十章 统计的综合评价统计的综合评价统统 计计 学学 概概 论论中南大学中南大学第十章第十章 相关与回归相关与回归统统 计计 学学 概概 论论中南大学中南大学联系与相互影响是普遍的现象联系与相互
2、影响是普遍的现象受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率事物相互间关系的质的解释:自然的、社会的、事物相互间关系的质的解释:自然的、社会的、经济的、心理的经济的、心理的事物相互间关系的量的分析:两变量或多变量事物相互间关系的量的分析:两变量或多变量间的数量关系。在间的数量关系。在可以解释的质的关系基础上可以解释的质的关系基础上进行相关分析和回归分析进行相关分析和回归分析统统 计计 学学 概概 论论中南大学中南大学相关分析的意义相关分析的意义相关分析的意义相关分析的意义第一节第一节 相关分析概述相关分析概述社会经济现象中,一些现象与另一些现
3、象之间往往存社会经济现象中,一些现象与另一些现象之间往往存社会经济现象中,一些现象与另一些现象之间往往存社会经济现象中,一些现象与另一些现象之间往往存在着依存关系,当我们用变量来反映这些现象的的特在着依存关系,当我们用变量来反映这些现象的的特在着依存关系,当我们用变量来反映这些现象的的特在着依存关系,当我们用变量来反映这些现象的的特征时,便表现为变量之间的依存关系。征时,便表现为变量之间的依存关系。征时,便表现为变量之间的依存关系。征时,便表现为变量之间的依存关系。在分析变量的依存关系时,我们把变量分为两种:在分析变量的依存关系时,我们把变量分为两种:自变量自变量因变量因变量引起其他变量发生变
4、化的量。引起其他变量发生变化的量。受自变量的影响发生对应变化的量受自变量的影响发生对应变化的量统统 计计 学学 概概 论论中南大学中南大学现象之间的相互关系,可以概括为两种不现象之间的相互关系,可以概括为两种不现象之间的相互关系,可以概括为两种不现象之间的相互关系,可以概括为两种不同的类型:同的类型:同的类型:同的类型:(一)(一)(一)(一)函数关系函数关系函数关系函数关系(二)(二)(二)(二)相关关系相关关系相关关系相关关系例如:家庭收入决定消费支出,收入的变化必例如:家庭收入决定消费支出,收入的变化必然引起消费支出的变化,这两个变量中收入是然引起消费支出的变化,这两个变量中收入是自变量
5、,而消费支出则是因变量。自变量,而消费支出则是因变量。统统 计计 学学 概概 论论中南大学中南大学函数关系函数关系指变量之间存在着确定性依存关系。指变量之间存在着确定性依存关系。即当一个或一组变量每取一个值时,相应的即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应另一个变量必然有一个确定值与之对应。函数关系可以用一个确定的公式,即函数式函数关系可以用一个确定的公式,即函数式 来表示。来表示。或:或:Y=F(X)统统 计计 学学 概概 论论中南大学中南大学相关关系相关关系指变量之间存在着非确定性依存关系。指变量之间存在着非确定性依存关系。即当一个或一组变量每取一个值时,相
6、应的另即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同值与之对应一个变量可能有多个不同值与之对应。例例2、根据消费理论,商品需求量、根据消费理论,商品需求量Q与商品价格与商品价格P、居民收入居民收入I之间具有相关关系:之间具有相关关系:相关关系可用统计模型:相关关系可用统计模型:相关关系可用统计模型:相关关系可用统计模型:或:或:Y=F(X)+式中,为影响式中,为影响Y的除的除X外的其他随机因素。外的其他随机因素。统统 计计 学学 概概 论论中南大学中南大学 单相关单相关是两个变量之间存在的相关是两个变量之间存在的相关关系,即一个因变量与一个自变量之关系,即一个因变量与一个自变量
7、之间的依存关系。因此也称为间的依存关系。因此也称为一元相关。一元相关。一元相关。一元相关。复相关复相关也称多元相关,是指三个或也称多元相关,是指三个或三个以上变量之间存在的相关关系,三个以上变量之间存在的相关关系,通常涉及一个因变量与两个或更多个通常涉及一个因变量与两个或更多个自变量,也称自变量,也称多元相关。多元相关。多元相关。多元相关。相关关系的种类相关关系的种类1 1、按相关关系涉及变量的多少可分为:、按相关关系涉及变量的多少可分为:统统 计计 学学 概概 论论中南大学中南大学直线相关直线相关直线相关直线相关当自变量当自变量当自变量当自变量X X X X值每变动一个单值每变动一个单值每变
8、动一个单值每变动一个单位,因变量位,因变量位,因变量位,因变量Y Y Y Y值则随着发生大致均等值则随着发生大致均等值则随着发生大致均等值则随着发生大致均等的变动,这就是直线相关。亦称为简的变动,这就是直线相关。亦称为简的变动,这就是直线相关。亦称为简的变动,这就是直线相关。亦称为简单相关或一元线性相关。单相关或一元线性相关。单相关或一元线性相关。单相关或一元线性相关。曲线相关曲线相关曲线相关曲线相关当自变量当自变量当自变量当自变量X X X X值每变动一个单值每变动一个单值每变动一个单值每变动一个单位,因变量位,因变量位,因变量位,因变量Y Y Y Y值则随之发生不均等的值则随之发生不均等的
9、值则随之发生不均等的值则随之发生不均等的变化,这就曲线相关。亦称为一元非变化,这就曲线相关。亦称为一元非变化,这就曲线相关。亦称为一元非变化,这就曲线相关。亦称为一元非线性相关线性相关线性相关线性相关 。相关关系的种类相关关系的种类2 2、按相关关系形式可分为:、按相关关系形式可分为:统统 计计 学学 概概 论论中南大学中南大学正相关正相关正相关正相关当自变量当自变量当自变量当自变量X X X X值增加(或减少)值增加(或减少)值增加(或减少)值增加(或减少)时,因变量时,因变量时,因变量时,因变量Y Y Y Y值也随之增加(或减少)值也随之增加(或减少)值也随之增加(或减少)值也随之增加(或
10、减少),这样的相关关系就是正相关,也叫,这样的相关关系就是正相关,也叫,这样的相关关系就是正相关,也叫,这样的相关关系就是正相关,也叫同向相关。同向相关。同向相关。同向相关。负相关负相关负相关负相关当自变量当自变量当自变量当自变量X X X X的值增加(或减少)的值增加(或减少)的值增加(或减少)的值增加(或减少)时,因变量时,因变量时,因变量时,因变量Y Y Y Y的值随之而减少(或增的值随之而减少(或增的值随之而减少(或增的值随之而减少(或增加),这样的相关关系就是负相关,加),这样的相关关系就是负相关,加),这样的相关关系就是负相关,加),这样的相关关系就是负相关,也叫异向相关。也叫异向
11、相关。也叫异向相关。也叫异向相关。相关关系的种类相关关系的种类3 3、按相关的方向可分为:、按相关的方向可分为:统统 计计 学学 概概 论论中南大学中南大学线性正相关线性正相关统统 计计 学学 概概 论论中南大学中南大学线性负相关线性负相关非线性相关非线性相关统统 计计 学学 概概 论论中南大学中南大学无(不)相关无(不)相关统统 计计 学学 概概 论论中南大学中南大学相关关系的种类相关关系的种类4 4、按相关关系的密切程度分为:、按相关关系的密切程度分为:完全相关完全相关完全相关完全相关因变量完全随自变量变动而变动,因变量完全随自变量变动而变动,因变量完全随自变量变动而变动,因变量完全随自变
12、量变动而变动,存在着严格的依存关系。即变量间的关系为存在着严格的依存关系。即变量间的关系为存在着严格的依存关系。即变量间的关系为存在着严格的依存关系。即变量间的关系为函数关系。函数关系。函数关系。函数关系。不完全相关不完全相关不完全相关不完全相关变量之间存在着不严格的依存关变量之间存在着不严格的依存关变量之间存在着不严格的依存关变量之间存在着不严格的依存关系,即因变量的变动除了受自变量变动的影系,即因变量的变动除了受自变量变动的影系,即因变量的变动除了受自变量变动的影系,即因变量的变动除了受自变量变动的影响外,还受其他因素的影响。它是相关关系响外,还受其他因素的影响。它是相关关系响外,还受其他
13、因素的影响。它是相关关系响外,还受其他因素的影响。它是相关关系的主要表现形式。的主要表现形式。的主要表现形式。的主要表现形式。完全不相关完全不相关完全不相关完全不相关自变量与因变量彼此独立,互不自变量与因变量彼此独立,互不自变量与因变量彼此独立,互不自变量与因变量彼此独立,互不影响,其数量变化毫无联系。影响,其数量变化毫无联系。影响,其数量变化毫无联系。影响,其数量变化毫无联系。统统 计计 学学 概概 论论中南大学中南大学(1 1)确定现象之间有无相关关系,以及相关)确定现象之间有无相关关系,以及相关关系的表现形态。关系的表现形态。(2 2)确定相关关系的密切程度。)确定相关关系的密切程度。(
14、3 3)确定相关关系的数字模型,并进行参数)确定相关关系的数字模型,并进行参数估计和拟合优度检验。估计和拟合优度检验。(4 4)回归预测,并分析估计标准误差。)回归预测,并分析估计标准误差。相关分析的主要内容包括:相关分析的主要内容包括:统统 计计 学学 概概 论论中南大学中南大学相关关系的测定相关关系的测定定性分析定性分析定性分析定性分析是依据研究者的理论知识和实是依据研究者的理论知识和实是依据研究者的理论知识和实是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关践经验,对客观现象之间是否存在相关践经验,对客观现象之间是否存在相关践经验,对客观现象之间是否存在相关关系,以及何种关系
15、作出判断关系,以及何种关系作出判断关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析定量分析定量分析在定性分析的基础上,通过编在定性分析的基础上,通过编在定性分析的基础上,通过编在定性分析的基础上,通过编制制制制相关表相关表相关表相关表、绘制、绘制、绘制、绘制相关图相关图相关图相关图、计算、计算、计算、计算相关系数相关系数相关系数相关系数与与与与判定系数判定系数判定系数判定系数等方法,来判断现象之间相等方法,来判断现象之间相等方法,来判断现象之间相等方法,来判断现象之间相关的方向、形态及密切程度关的方向、形态及密切程度关的方向、形态及密切程度关的方向、形态及密切程度统统 计计
16、 学学 概概 论论中南大学中南大学相关关系的测定相关关系的测定相关表相关表将两个变量伴随变动结果编将两个变量伴随变动结果编成一张统计表,即成一张统计表,即相关表相关表。简单相关表简单相关表两个变量两个变量均不分组均不分组而形而形成的相关表。成的相关表。分组相关表分组相关表对变量进行对变量进行分组分组而形成而形成的相关表。依两个变量是否同时分的相关表。依两个变量是否同时分组,又分为:组,又分为:单变量分组相关表单变量分组相关表只对其中一只对其中一个变量分组。个变量分组。单变量分组相关表单变量分组相关表对两个变量对两个变量同时分组。同时分组。统统 计计 学学 概概 论论中南大学中南大学简单相关表简
17、单相关表简单相关表简单相关表适用于所观察的样本单适用于所观察的样本单适用于所观察的样本单适用于所观察的样本单位数较少,不需要分组的情况位数较少,不需要分组的情况位数较少,不需要分组的情况位数较少,不需要分组的情况分组相关表分组相关表分组相关表分组相关表适用于所观察的样本单适用于所观察的样本单适用于所观察的样本单适用于所观察的样本单位数较多,标志变异又较复杂,需位数较多,标志变异又较复杂,需位数较多,标志变异又较复杂,需位数较多,标志变异又较复杂,需要分组的情况要分组的情况要分组的情况要分组的情况两种相关表的适用范围两种相关表的适用范围统统 计计 学学 概概 论论中南大学中南大学企业编号企业编号
18、月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个八个同类工业企业的月产量与生产费用同类工业企业的月产量与生产费用简单相关表简单相关表统统 计计 学学 概概 论论中南大学中南大学201345322223003500350400422400450715145050031250055032155060011 6006506570606555605055455040453540 固定资产原值固定资产原值平均每昼平均每昼夜产量夜产量(百万元)(百万元)(吨)(吨)2020个同类工
19、业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量分组相关表分组相关表统统 计计 学学 概概 论论中南大学中南大学相关关系的测定相关关系的测定相关图相关图将变量之间的伴随变动绘于坐标图将变量之间的伴随变动绘于坐标图上所形成的统计图。又称散点图。上所形成的统计图。又称散点图。简单相关图简单相关图根据未分组资料的原始数根据未分组资料的原始数据直接绘制的相关图。据直接绘制的相关图。分组相关图分组相关图根据分组资料绘制的相根据分组资料绘制的相关图。关图。统统 计计 学学 概概 论论中南大学中南大学正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关x xy yx
20、xy yx xy yx xy y用直角坐标系的用直角坐标系的x x轴代表自变量,轴代表自变量,y y轴轴代表因变量,代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。出来,用以表明相关点分布状况的图形。相关关系的测定相关关系的测定相关图的绘制相关图的绘制统统 计计 学学 概概 论论中南大学中南大学XY统计学统计学第十章第十章 相关与回归相关与回归统统 计计 学学 概概 论论中南大学中南大学相关系数相关系数在在直线相关直线相关直线相关直线相关的条件下,用以反映的条件下,用以反映两变量两变量间间线性相关线性相关线
21、性相关线性相关密切程度的统计指标,用密切程度的统计指标,用r表示表示其基本算法是英国统计学家皮尔逊所创的乘积动其基本算法是英国统计学家皮尔逊所创的乘积动差法,简称积差法。差法,简称积差法。相关关系的测定相关关系的测定统统 计计 学学 概概 论论中南大学中南大学相关系数相关系数r r的取值的取值范围:范围:-1r1-1r1-1r1-1r10|r|10|r|10|r|10|r|1表示存在表示存在表示存在表示存在不同程度线性相关不同程度线性相关不同程度线性相关不同程度线性相关:|r|r|0 r0 为为正相关正相关,r 0 r 0,则,则F值值0。当我们设当我们设 1=0 时,则较大的时,则较大的F值
22、将值将推翻这一假设。推翻这一假设。故拒绝原假设,接受备择假设,故拒绝原假设,接受备择假设,即认为回归方程是显著的。即认为回归方程是显著的。统统 计计 学学 概概 论论中南大学中南大学 估计的前提估计的前提:回归方程经过检验,证:回归方程经过检验,证明明 X X 和和 Y Y 的关系在统计上是显著的。的关系在统计上是显著的。回归分析的点估计回归分析的点估计:对于给定的:对于给定的 X X 值,值,求出求出 Y Y 平均值的一个估计值或平均值的一个估计值或 Y Y 的一个个别值。的一个个别值。若若 x=169x=169,则:则:统统 计计 学学 概概 论论中南大学中南大学利用点估计得到的利用点估计
23、得到的Y Y平均值的点估计值和平均值的点估计值和Y Y的一的一个个别值其结果是相同的。个个别值其结果是相同的。点估计不能提供估计量的精确度。点估计不能提供估计量的精确度。在样本自变量取值范围之外进行预测要特别谨在样本自变量取值范围之外进行预测要特别谨慎。慎。使用点估计应注意的问题使用点估计应注意的问题统统 计计 学学 概概 论论中南大学中南大学 回归分析的区间估计:对于给定的回归分析的区间估计:对于给定的 X 值,求值,求出出 Y 的平均值的置信区间或的平均值的置信区间或 Y 的一个个别值的预的一个个别值的预测区间。测区间。统统 计计 学学 概概 论论中南大学中南大学 Y Y 的平均值的置信区
24、间估计的平均值的置信区间估计总体的回归模型总体的回归模型样本回归方程样本回归方程如果样本回归方程通过检验,则:如果样本回归方程通过检验,则:如果给定如果给定 x x=x x0 0 ,则有:则有:分布形态?分布形态?统统 计计 学学 概概 论论中南大学中南大学可以证明,可以证明,0 0 是服从正态分布的,是服从正态分布的,其数学期望:其数学期望:其方差:其方差:其标准差:其标准差:统统 计计 学学 概概 论论中南大学中南大学对于给定的对于给定的 x=xx=x0 0 ,Y Y 的的1-1-置信区间为:置信区间为:也就是:也就是:自由度为自由度为n-2n-2的的 t t 分布分布的的 水平双侧分位数
25、水平双侧分位数统统 计计 学学 概概 论论中南大学中南大学统统 计计 学学 概概 论论中南大学中南大学 Y 的个别值的置信区间估计的个别值的置信区间估计 对于给定的对于给定的 X=X0,如果要预测如果要预测Y 的一个个别值的一个个别值 Y0 的置信区间,则其相应的残差为:的置信区间,则其相应的残差为:Y 的个别值相对于其的个别值相对于其平均值的方差平均值的方差当当X=X0时,所时,所估计的估计的Y0 的方的方差组成差组成与用与用 估计估计 Y平均值平均值相联系的方差相联系的方差统统 计计 学学 概概 论论中南大学中南大学即:即:Y Y0 0的方差为:的方差为:即:即:则:则:Y Y 的一个个别
26、值的一个个别值 Y Y0 0 的标准差的估计值为:的标准差的估计值为:统统 计计 学学 概概 论论中南大学中南大学 对于给定的对于给定的 X X0 0,Y Y 的一个个别值的一个个别值Y Y0 0 的的预测区间估计值为:预测区间估计值为:也就是:也就是:与估计与估计Y Y的平均值公式相比,的平均值公式相比,此公式中多了一项此公式中多了一项“1 1”,因此,这个,因此,这个置信区间要相对大一些置信区间要相对大一些统统 计计 学学 概概 论论中南大学中南大学学生身高体重估计值ABCDEFGHIJ1581601621641661681701721741764750485562605261706524
27、964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-541381670570279220 3303295546-00若令若令=0.05,则有,则有 t/2(n-2)=2.3
28、1当当 时,时,得到最小值。得到最小值。当当 时,时,的值随的值随 的的减少或增加而逐步增大。减少或增加而逐步增大。统统 计计 学学 概概 论论中南大学中南大学统统 计计 学学 概概 论论中南大学中南大学回归方程的估计与预测回归方程的估计与预测估计的前提估计的前提:回归方程经过检验,证明:回归方程经过检验,证明 X X 和和 Y Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。点估计点估计 对于给定的对于给定的 X X 值,求出值,求出 Y Y 平均值平均值的一个估计值或的一个估计值或 Y Y 的一个个别值的预测值。的一个个别值的预测值。区间估计区间估计 对于给定的对于给定的 X
29、X 值,求出值,求出 Y Y 的的平均值的置信区间或平均值的置信区间或 Y Y 的一个个别值的预的一个个别值的预测区间。测区间。统统 计计 学学 概概 论论中南大学中南大学点估计点估计点估计点估计若若 x=80(十万吨)十万吨),则:则:统统 计计 学学 概概 论论中南大学中南大学区间估计区间估计区间估计区间估计对于给定的对于给定的 x=xx=x0 0 ,Y Y 的的1-1-置信区间为置信区间为自由度为自由度为n-2n-2的的 t t 分布分布的的 水平双侧分位数水平双侧分位数统统 计计 学学 概概 论论中南大学中南大学即:即:即:即:在大样本条件下,近似有:在大样本条件下,近似有:在大样本条件下,近似有:在大样本条件下,近似有:统统 计计 学学 概概 论论中南大学中南大学本章小节