《一元线性回归的基本问题优秀PPT.ppt》由会员分享,可在线阅读,更多相关《一元线性回归的基本问题优秀PPT.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 相关与回来分析相关与回来分析 第一节第一节 相关与回来的基本概念相关与回来的基本概念 其次节其次节 一元线性回来分析一元线性回来分析v睡眠时间同学习成果之间的关系v学习成果同收入之间的关系v学历同收入之间的关系国内探讨:学历、年龄、收入关系国内探讨:学历、年龄、收入关系国外探讨:学历、年龄、收入关系国外探讨:学历、年龄、收入关系第一节第一节 相关与回来的基本概念相关与回来的基本概念v函数关系与相关关系函数关系与相关关系v相关关系的种类相关关系的种类v相关关系的推断方法相关关系的推断方法1.1 函数关系与相关关系函数关系与相关关系(一一)函数关系函数关系1.定义定义当一个或几个变量
2、取确定的值时,当一个或几个变量取确定的值时,另一个变量有确定值与之相对应,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数我们称这种关系为确定性的函数关系。关系。2.函数关系特点函数关系特点(1)是一一对应的确定关系;)是一一对应的确定关系;(2)设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变更更,并并完完全全依依靠靠于于 x,当当变变量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称称为为自自变量,变量,y 称为因变量称为因变量(3
3、)各观测点)各观测点(x,y)落在一条线上落在一条线上 x xy y3.函数关系举例函数关系举例 函数关系的例子函数关系的例子某种商品的销售额某种商品的销售额(y)与销售量与销售量(x)之间的关之间的关系可表示为系可表示为 y=p x(p 为单价为单价)圆的面积与半径之间的关系可表示为圆的面积与半径之间的关系可表示为S=r2 企业的原材料消耗额企业的原材料消耗额(y)与产量与产量(x1)、单位产单位产量消耗量消耗(x2)、原材料价格原材料价格(x3)之间的关系可之间的关系可表示为表示为y=x1 x2 x3 1.定义:定义:当一个或几个相互联系的变量当一个或几个相互联系的变量取确定数值时,与之相
4、对应的另一变量取确定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在的值虽然不确定,但它仍按某种规律在确定的范围内变更。变量间的这种关系确定的范围内变更。变量间的这种关系称为具有不确定性的相关关系。称为具有不确定性的相关关系。现象之间客观存在的不严格、不确现象之间客观存在的不严格、不确定的数量依存关系。定的数量依存关系。(二)相关关系(二)相关关系2.相关关系特点相关关系特点(1)变量间关系不能用函数关系精确表达;)变量间关系不能用函数关系精确表达;(2)一一个个变变量量的的取取值值不不能能由由另另一一个个变变量量唯唯一一确确定定;当当变变量量 x 取取某某个个值值的的时时候候,
5、变变量量 y 的的取取值可能有几个;值可能有几个;(3)各观测点()各观测点(x,y)分布在某条线的四周。)分布在某条线的四周。x xy y 相关关系的例子相关关系的例子商品的消费量商品的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系商品的消费量商品的消费量(y)与物价与物价(x)之间的关系之间的关系商品销售额商品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温温度度(x3)之间的关系之间的关系收入水平收入水平(y)与受教化程度与受教化程度(x)之间的关系之间的关系3.相关关系举例相关关系举例
6、1.2相关关系的种类相关关系的种类相关关系相关关系按相关程度分类按相关程度分类按相关方向分类按相关方向分类按相关形式分类按相关形式分类按所研究变量多少分类按所研究变量多少分类(1)完全相关:当一种现象的数量变更完全由)完全相关:当一种现象的数量变更完全由另一种现象的数量变更所确定时,称这两种另一种现象的数量变更所确定时,称这两种现象间的关系为完全相关。现象间的关系为完全相关。(2)不相关:当两种现象互不影响,其数量变)不相关:当两种现象互不影响,其数量变更各自独立时,称为不相关现象。更各自独立时,称为不相关现象。(3)两种现象之间的关系介于完全相关和不相)两种现象之间的关系介于完全相关和不相关
7、之间,称为不完全相关。关之间,称为不完全相关。1.按相关的程度可划分为按相关的程度可划分为:完全相关,不完全相关和不相关完全相关,不完全相关和不相关(1)当两种相关现象之间的关系大致呈现为线)当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。性关系时,称之为线性相关。(2)当两种相关现象之间的关系不表现为直线)当两种相关现象之间的关系不表现为直线关系,而是近似于某种曲线方程的关系,则关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。这种相关关系称为非线性相关。2.按相关的形式可划分为按相关的形式可划分为:线性相关,非线性相关线性相关,非线性相关(1)正相关:两个相关
8、现象间,当一个变量的)正相关:两个相关现象间,当一个变量的数值增加(或削减)时,另一个变量的数值也数值增加(或削减)时,另一个变量的数值也随之增加(或削减),即同方向变更。随之增加(或削减),即同方向变更。例如收入与消费的关系。例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或削减)负相关:当一个变量的数值增加(或削减)时,而另一个变量的数值相反地呈削减(或增时,而另一个变量的数值相反地呈削减(或增加)趋势变更,即反方向变更。加)趋势变更,即反方向变更。例如物价与消费的关系。例如物价与消费的关系。3.按相关的方向可划分为按相关的方向可划分为:正相关,负相关正相关,负相关(1)当只探讨
9、两个变量时,它们之间的相关,)当只探讨两个变量时,它们之间的相关,称为单相关。称为单相关。(2)当所探讨的是一个变量对两个或两个以)当所探讨的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。水平之间的相关关系便是一种复相关。(3)在某一现象与多种现象相关的场合,假)在某一现象与多种现象相关的场合,假定其他变量不变,只考察其中两个变量的相定其他变量不变,只考察其中两个变量的相关关系称为偏相关。关关系称为偏相关。例如,在假定人们的收入水平
10、不变的条件下,例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一某种商品的需求与其价格水平的关系就是一种偏相关。种偏相关。4.按相关关系涉及的变量多少可划分为按相关关系涉及的变量多少可划分为:单相关,复相关和偏相关单相关,复相关和偏相关相关关系的图示 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相
11、关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 定性分析定性分析是依据探讨者的理论学问和实践阅是依据探讨者的理论学问和实践阅历,对客观现象之间是否存在相关历,对客观现象之间是否存在相关关系,以及何种关系作出推断。关系,以及何种关系作出推断。定量分析定量分析在定性分析的基础上,通过编制相在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数关表、绘制相关图、计算相关系数等方法,来推断现象之间相关的方等方法,来推断现象之间相关的方向、形态及亲密程度。向、形态及亲密程度。1.3 相关关系的推断相关关系的推断(一)相关表(一)相关表相关表是一种反映变量之间相关关系的统相
12、关表是一种反映变量之间相关关系的统计表。计表。将自变量将自变量x的数值依据从小到大的依次排的数值依据从小到大的依次排列,然后再将与其相关的因变量列,然后再将与其相关的因变量y的对应的对应数值平行排列,便可形成简洁的相关表。数值平行排列,便可形成简洁的相关表。例:为了探讨分析某种产品完成量与其单位产品成本例:为了探讨分析某种产品完成量与其单位产品成本之间的关系,调查之间的关系,调查30个同类公司得到的原始数据如表。个同类公司得到的原始数据如表。整理后有整理后有(二)相关图(二)相关图相关图也称散点图,是在平面直角坐标系相关图也称散点图,是在平面直角坐标系中,以横轴表示变量中,以横轴表示变量 x,
13、纵轴表示变量,纵轴表示变量y,将两者对应的数值形成的坐标点,将两者对应的数值形成的坐标点(x,y)在图中标出,即可看出变量之间)在图中标出,即可看出变量之间关系亲密程度。如下图关系亲密程度。如下图(销售收入与广告费相关图)(销售收入与广告费相关图)销售收入与广告费相关图销售收入与广告费相关图相关图的相关检定1.分别作x、y中值线 2.数各象限和中值线上的点3.计算 4.判定:将N和相关检定表界限值比较,判定相关性(三)相关系数及其计算(三)相关系数及其计算1.相关系数相关系数早在早在1890年,英国统计学家皮尔生(年,英国统计学家皮尔生(Pearson)便提出了一个测定两个变量线性关系的计算公
14、便提出了一个测定两个变量线性关系的计算公式,通常称为积距相关系数。式,通常称为积距相关系数。计算公式:计算公式:式中:分子是两个变量式中:分子是两个变量x和和y的协方差;分母是两的协方差;分母是两个变量的标准差。个变量的标准差。2.相关关系的测度相关关系的测度(相关系数)(相关系数)v 样本相关系数的计算公式样本相关系数的计算公式或化简为或化简为计算相关系数计算相关系数的的“积差法积差法”例例1.某企业某企业10名工人的工龄和年工资资料如下:名工人的工龄和年工资资料如下:职工编号职工编号职工编号职工编号1 2 3 4 5 6 7 8 9 101 2 3 4 5 6 7 8 9 10工龄工龄工龄
15、工龄X(X(年年年年)4 4 5 6 7 8 8 9 9 104 4 5 6 7 8 8 9 9 10工资工资工资工资Y Y(百元)(百元)(百元)(百元)42 46 50 60 64 68 74 72 80 8442 46 50 60 64 68 74 72 80 84要求:计算相关系数,已知条件如下要求:计算相关系数,已知条件如下例例2.某企业某企业200名工人的工龄和年工资资料如下,名工人的工龄和年工资资料如下,计算两者的相关系数,已知条件如下:计算两者的相关系数,已知条件如下:表表1 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位:元元年份年份人均人均国
16、民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148【例例例例】在在在在探探探探讨讨讨讨我我我我国国国国人人人人均均均均消消消消费费费费水水水水平平平平的的的的问问问问题题题题中中中中,把把把把全全全全国国国国人人人人均
17、均均均消消消消费费费费额额额额记记记记为为为为y y,把把把把人人人人均均均均国国国国民民民民收收收收入入入入记记记记为为为为x x。收收收收集集集集到到到到1981198119931993年年年年的样本数据的样本数据的样本数据的样本数据(xi(xi,yi)yi),i=1,2,i=1,2,,1313,计算相关系数。,计算相关系数。,计算相关系数。,计算相关系数。v解:依据样本相关系数的计算公式有解:依据样本相关系数的计算公式有v v人人均均国国民民收收入入与与人人均均消消费费金金额额之之间间的的相相关关系系 数为数为 0.99873.相关系数取值及其意义相关系数取值及其意义(1)r 的取值范围
18、是的取值范围是-1,1(2)|r|=1,为完全相关,为完全相关r=1,为完全正相关,为完全正相关r=-1,为完全负正相关,为完全负正相关(3)r=0,不存在线性相关关系,不存在线性相关关系(4)-1 r0,为负相关;,为负相关;0r 1,为正相关,为正相关(5)|r|越越趋趋于于1表表示示关关系系越越亲亲密密;|r|越越趋趋于于0表表示示关系越不亲密关系越不亲密4.相关程度评价标准相关程度评价标准vv0|r|0.30.3为微弱相关微弱相关vv0.3|r|0.50.5为低度相关低度相关vv0.5|r|0.80.8为显著相关著相关vv0.8|r|11为高度相关高度相关相关系数检定表其次节其次节 一
19、元线性回来分析一元线性回来分析一、一元线性回来的基本问题一、一元线性回来的基本问题(一)回来的来源(一)回来的来源 “回来回来”这个统计学术语,最早接受者这个统计学术语,最早接受者是英国遗传学家高尔登,他把这种统计分是英国遗传学家高尔登,他把这种统计分析方法应用于探讨生物学的遗传问题,指析方法应用于探讨生物学的遗传问题,指诞生物后代有回复或回来到其上代原有特诞生物后代有回复或回来到其上代原有特性的倾向。高尔登的学生皮尔逊接着探讨,性的倾向。高尔登的学生皮尔逊接着探讨,把回来与数学方法联系起来,把代表现象把回来与数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回来之间一般数量关系的直
20、线或曲线称为回来直线或回来曲线。直线或回来曲线。(二)什么是回来分析?(二)什么是回来分析?1.从从一一组组样样本本数数据据动动身身,确确定定变变量量之之间间的的数数学关系式;学关系式;2.对对这这些些关关系系式式的的可可信信程程度度进进行行各各种种统统计计检检验验,并并从从影影响响某某一一特特定定变变量量的的诸诸多多变变量量中中找出哪些变量的影响显著,哪些不显著;找出哪些变量的影响显著,哪些不显著;3.利利用用所所求求的的关关系系式式,依依据据一一个个或或几几个个变变量量的的取取值值来来预预料料或或限限制制另另一一个个特特定定变变量量的的取取值,并给出这种预料或限制的精确程度。值,并给出这种
21、预料或限制的精确程度。(三)回来模型的类型(三)回来模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回来模型回来模型多元回来多元回来一元回来一元回来线性线性回来回来非线性非线性回来回来线性线性回来回来非线性非线性回来回来1.一元线性回来模型一元线性回来模型(1)当当只只涉涉及及一一个个自自变变量量时时称称为为一一元元回回来来,若若因因变变量量 y 与与自自变变量量 x 之之间间为为线线性性关关系系时时称称为为一元线性回来。一元线性回来。(2)对对于于具具有有线线性性相相关关关关系系的的两两个个变变量量,可可以以用一个线性方程来近似表
22、示它们之间的关系。用一个线性方程来近似表示它们之间的关系。(3)描描述述因因变变量量 y 如如何何依依靠靠于于自自变变量量 x 和和误误差差项项的方程称为回来模型。的方程称为回来模型。二、一元线性回来模型的估计二、一元线性回来模型的估计(一)回来方程(一)回来方程1.描描述述 y 的的平平均均值值或或期期望望值值如如何何依依靠靠于于 x 的的方方程程称为回来方程。称为回来方程。2.简洁线性回来方程的形式:简洁线性回来方程的形式:a是是回回来来直直线线在在 y 轴轴上上的的截截距距,是是当当 x=0 时时 y 的的期期望值;望值;b是是直直线线的的斜斜率率,称称为为回回来来系系数数,表表示示当当
23、 x 每每变变动动一个单位时,一个单位时,y 的平均变动值。的平均变动值。最小二乘法最小二乘法(图示)(图示)x xy y(xn,yn)(x1,y1)(x2,y2)(xi,yi)123哪条线最能够表达哪条线最能够表达x和和y之间的关系?之间的关系?最小二乘法最小二乘法(图示)(图示)x xy y(xn,yn)(x1,y1)(x2,y2)(xi,yi)ei=yi-yi2e1e2e3e4e6e7e8e9e53、回来系数的估计的最小二乘法公式、回来系数的估计的最小二乘法公式 设设 将对求偏导数,并令其等于零,可得将对求偏导数,并令其等于零,可得:加以整理后有:加以整理后有:最小二乘法最小二乘法(a 和和 b 的计算公式的计算公式)解方程组解方程组可得求解可得求解 a 和和 b 的标准方程如下:的标准方程如下:例:某种食品的需求量与人口增长量之间关系,数据:例:某种食品的需求量与人口增长量之间关系,数据:上式中b 表示人口增加量每增加(或削减)1千人,该种食品的年需求量平均来说增加(或削减)0.5301(吨)即5.301吨。v课后习题2、3