《统计学第七章相关回归分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第七章相关回归分析幻灯片.ppt(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第七章相关回归分析第1页,共55页,编辑于2022年,星期二了解相关关系的概念及种类;了解相关关系的概念及种类;掌握相关分析的原理、几种常用相关系数掌握相关分析的原理、几种常用相关系数的测定方法及相关系数取值含义;的测定方法及相关系数取值含义;掌握回归分析的原理、方法及应用,重点掌握回归分析的原理、方法及应用,重点掌握简单线性回归方程的拟合及应用,明掌握简单线性回归方程的拟合及应用,明确直线回归方程中待定参数的含义。确直线回归方程中待定参数的含义。具体要求具体要求第2页,共55页,编辑于2022年,星期二第一节第一节相关分析的基本问题相关分析的基本问题 一、一、相关关系与函数关系相关关系
2、与函数关系 二、二、相关关系的种类相关关系的种类 三、三、相关分析的主要内容相关分析的主要内容 第3页,共55页,编辑于2022年,星期二 一、相关关系与函数关系相关关系与函数关系 1.1.函数关系函数关系现象之间存在的现象之间存在的确定性确定性的数量依存关系的数量依存关系 圆的面积圆的面积S与半径与半径r之间的数量关系之间的数量关系 GDP与总产出及中间投入之间的关系与总产出及中间投入之间的关系 例例:S=R2GDP=总产出总产出-中间投入中间投入第4页,共55页,编辑于2022年,星期二2.2.相关关系相关关系 也称统计相关,是指现象之间存在的也称统计相关,是指现象之间存在的非确定性非确定
3、性的的数量依存关系数量依存关系 非一一对应非一一对应商品价格与商品需求量之间存在的变动关系商品价格与商品需求量之间存在的变动关系 例例:施肥量与农作物产量的关系施肥量与农作物产量的关系 第5页,共55页,编辑于2022年,星期二1.1.1.1.是一一对应的确定关系是一一对应的确定关系是一一对应的确定关系是一一对应的确定关系2.2.2.2.设有两个变量设有两个变量设有两个变量设有两个变量 x x x x 和和和和 y y y y,变量,变量,变量,变量 y y y y 完全依赖于完全依赖于完全依赖于完全依赖于 x x x x,当变量,当变量,当变量,当变量 x x x x 取某取某取某取某个数值
4、时,个数值时,个数值时,个数值时,y y y y 依确定的关系取依确定的关系取依确定的关系取依确定的关系取相应的值,则称相应的值,则称相应的值,则称相应的值,则称 y y y y 是是是是 x x x x 的的的的函数,记为函数,记为函数,记为函数,记为 y=f(x)y=f(x)y=f(x)y=f(x),其中,其中,其中,其中 x x x x 称为自变量,称为自变量,称为自变量,称为自变量,y y y y 称为因变量称为因变量称为因变量称为因变量3.3.3.3.各观测点落在一条线上各观测点落在一条线上各观测点落在一条线上各观测点落在一条线上 1.1.1.1.变量间关系不能用函数关系精确表达变量
5、间关系不能用函数关系精确表达变量间关系不能用函数关系精确表达变量间关系不能用函数关系精确表达2.2.2.2.一一一一个个个个变变变变量量量量的的的的取取取取值值值值不不不不能能能能由由由由另另另另一一一一个个个个变变变变量量量量唯唯唯唯一一一一确确确确定定定定,当当当当变变变变量量量量 x x x x 取取取取某某某某个个个个值值值值时时时时,变量变量变量变量 y y y y 的取值可能有几个的取值可能有几个的取值可能有几个的取值可能有几个3.3.3.3.各观测点分布在直线周围各观测点分布在直线周围各观测点分布在直线周围各观测点分布在直线周围 x xy y x xy y第6页,共55页,编辑于
6、2022年,星期二2.2.函数关系与函数关系与相关关系的联系与区别相关关系的联系与区别 联联系系区区别别函数关系有时也可能表现为相关关系函数关系有时也可能表现为相关关系相关关系通常要利用相应的函数关系式来表现相关关系通常要利用相应的函数关系式来表现 确定性依存关系与非确定依存关系确定性依存关系与非确定依存关系函数关系往往因为有观察或测量误差以及各种随机因素的干扰等函数关系往往因为有观察或测量误差以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;而在研究相关关系原因,在实际中常常通过相关关系表现出来;而在研究相关关系时,其数量间的规律性了解得越深刻的时候,则相关关系越有可时,其数量
7、间的规律性了解得越深刻的时候,则相关关系越有可能转化为函数关系或借助函数关系来表现。能转化为函数关系或借助函数关系来表现。第7页,共55页,编辑于2022年,星期二 相关关系相关关系 变量个数的多少变量个数的多少变量个数的多少变量个数的多少 相关的密切程度相关的密切程度相关的密切程度相关的密切程度 单相关单相关单相关单相关 多元相关多元相关多元相关多元相关 相关的方向相关的方向相关的方向相关的方向 相关的形式相关的形式相关的形式相关的形式 线性相关线性相关线性相关线性相关 非线性相关非线性相关非线性相关非线性相关 完全相关完全相关完全相关完全相关 不完全相关不完全相关不完全相关不完全相关 不相
8、关不相关不相关不相关 正相关正相关正相关正相关 负相关负相关负相关负相关 二、相关关系的种类相关关系的种类 第8页,共55页,编辑于2022年,星期二1.1.确定变量之间有无相关关系及其表现形式确定变量之间有无相关关系及其表现形式 三、相关分析的主要内容相关分析的主要内容 2.2.确定相关关系的密切程度确定相关关系的密切程度3.3.检验现象统计相关的显著性检验现象统计相关的显著性 4.4.广义上讲,相关分析还包括拟合回归方程广义上讲,相关分析还包括拟合回归方程 第9页,共55页,编辑于2022年,星期二第二节第二节相关关系的测度相关关系的测度 一、一、相关关系的一般测度相关关系的一般测度 二、
9、二、相关系数的测定相关系数的测定 三、三、等级相关系数的测定等级相关系数的测定 第10页,共55页,编辑于2022年,星期二 一、相关关系的一般判断相关关系的一般判断 1.1.定性分析定性分析根据一定的经济理论和实根据一定的经济理论和实践经验的总结践经验的总结 2.2.相关表和相关图相关表和相关图 防止虚假相关或伪相关防止虚假相关或伪相关!第11页,共55页,编辑于2022年,星期二(1)简单相关表)简单相关表 销售额与流通费销售额与流通费用相关表用相关表 散点图散点图 第12页,共55页,编辑于2022年,星期二(2)分组相关表)分组相关表适用场合:原始资料较多适用场合:原始资料较多种类:种
10、类:单变量分组表单变量分组表只对自变量进行分组,因变量不分组只对自变量进行分组,因变量不分组 双变量分组表双变量分组表将自变量和因变量都进行分组将自变量和因变量都进行分组 第13页,共55页,编辑于2022年,星期二某市家庭收入与消费支出相关表某市家庭收入与消费支出相关表 散点图散点图 单变量分组单变量分组第14页,共55页,编辑于2022年,星期二家庭收入与消费支出相关表家庭收入与消费支出相关表 双变量分组双变量分组第15页,共55页,编辑于2022年,星期二 二、相关系数的测定相关系数的测定 相相关系数是在关系数是在直线相关直线相关条件下,表明两个现象之条件下,表明两个现象之间相关关系的方
11、向和密切程度的综合性指标。一间相关关系的方向和密切程度的综合性指标。一般用符号般用符号r r表示。表示。类型类型直线相关系数直线相关系数 等级相关系数等级相关系数 第16页,共55页,编辑于2022年,星期二1.1.直线相关系数的计算直线相关系数的计算(1)积差法)积差法第17页,共55页,编辑于2022年,星期二例例销售额销售额流通费用流通费用第18页,共55页,编辑于2022年,星期二(2)简捷计算法)简捷计算法当平均数有很多小数位或除不尽时当平均数有很多小数位或除不尽时,比,比较方便。较方便。第19页,共55页,编辑于2022年,星期二第20页,共55页,编辑于2022年,星期二(3)分
12、组资料的简捷计算法公式)分组资料的简捷计算法公式单变量分组单变量分组双变量分组双变量分组第21页,共55页,编辑于2022年,星期二(4)直线相关系数直线相关系数r的统计检验的统计检验 第22页,共55页,编辑于2022年,星期二(5)直线相关系数直线相关系数r的取值含义的取值含义 r r界于界于界于界于-1-1与与与与1 1之间之间之间之间 当当当当r0,r0,r0,表示正相关表示正相关表示正相关表示正相关 绝对值绝对值绝对值绝对值r r 越接近越接近越接近越接近1 1,线性相关越密切,线性相关越密切,线性相关越密切,线性相关越密切 绝对值绝对值绝对值绝对值r r 越接近越接近越接近越接近0
13、 0,相关程度越弱,相关程度越弱,相关程度越弱,相关程度越弱 经验判断:相关系数在经验判断:相关系数在经验判断:相关系数在经验判断:相关系数在0.30.3以下为无相关,以下为无相关,以下为无相关,以下为无相关,0.30.30.50.5为低度相关,为低度相关,为低度相关,为低度相关,0.50.50.80.8为中度相关,为中度相关,为中度相关,为中度相关,0.80.8以上是高度相关。以上是高度相关。以上是高度相关。以上是高度相关。第23页,共55页,编辑于2022年,星期二 三、等级相关系数的测定方法相关系数的测定方法 1.1.1.1.等级相关的含义等级相关的含义等级相关的含义等级相关的含义 就是
14、把有关联的数量标志或品质标志的具体表就是把有关联的数量标志或品质标志的具体表就是把有关联的数量标志或品质标志的具体表就是把有关联的数量标志或品质标志的具体表现按等级次序排列,形成现按等级次序排列,形成现按等级次序排列,形成现按等级次序排列,形成X X X X和和和和Y Y Y Y这两个序列,再测定这这两个序列,再测定这这两个序列,再测定这这两个序列,再测定这两个序列之间的相关程度,得到的相关系数即为等级两个序列之间的相关程度,得到的相关系数即为等级两个序列之间的相关程度,得到的相关系数即为等级两个序列之间的相关程度,得到的相关系数即为等级相关系数。常用的有斯皮尔曼相关系数、肯特尔相关相关系数。
15、常用的有斯皮尔曼相关系数、肯特尔相关相关系数。常用的有斯皮尔曼相关系数、肯特尔相关相关系数。常用的有斯皮尔曼相关系数、肯特尔相关系数等。系数等。系数等。系数等。定等级定等级 依此计算每对观察值相应的等级差依此计算每对观察值相应的等级差D D 计算计算D D2 2 代入公式代入公式2.斯皮尔曼斯皮尔曼斯皮尔曼斯皮尔曼(Spearman)(Spearman)(Spearman)(Spearman)相关系数的计算步骤相关系数的计算步骤相关系数的计算步骤相关系数的计算步骤第24页,共55页,编辑于2022年,星期二例:某公司例:某公司6位员工的学历及其年终能力考核结论如表位员工的学历及其年终能力考核结
16、论如表7-6所示,求学历与能力的相关系数。所示,求学历与能力的相关系数。第25页,共55页,编辑于2022年,星期二3.肯特尔相关系数肯特尔相关系数肯特尔相关系数肯特尔相关系数n样本容量样本容量,i换位总次数换位总次数 上图的例子,有上图的例子,有第26页,共55页,编辑于2022年,星期二 相关分析只能说明两个变量之间的相互依存关相关分析只能说明两个变量之间的相互依存关系,并不一定代表因果关系。在计算相关系数之前,系,并不一定代表因果关系。在计算相关系数之前,一般要先做定性分析,否则就有可能因为数据的偶一般要先做定性分析,否则就有可能因为数据的偶然巧合,得到较高的相关系数,从而把虚假相关视然
17、巧合,得到较高的相关系数,从而把虚假相关视为可信的相关。为可信的相关。说说 明明请您举例!请您举例!有人曾对教师薪金的提高和酒价的上涨作了相关分有人曾对教师薪金的提高和酒价的上涨作了相关分析,计算得到一个较大的相关系数,这是否表明教析,计算得到一个较大的相关系数,这是否表明教师薪金提高导致酒的消费量增加,从而导致酒价上师薪金提高导致酒的消费量增加,从而导致酒价上涨呢?涨呢?第27页,共55页,编辑于2022年,星期二第三节第三节回归分析的基本问题回归分析的基本问题 一、回归分析的概念一、回归分析的概念 二、二、回归分析的主要内容回归分析的主要内容三、回归分析的特点三、回归分析的特点四、回归模型
18、的种类四、回归模型的种类 第28页,共55页,编辑于2022年,星期二 一、回归分析的概念 相关分析的不足:只能相关分析的不足:只能分析现象之间相关关系的方向和分析现象之间相关关系的方向和相关的密切程度,但不能判断现象之间具体的数量变动依相关的密切程度,但不能判断现象之间具体的数量变动依存关系,也不能根据相关系数来估计或预测因变量存关系,也不能根据相关系数来估计或预测因变量y可能可能发生的数值。发生的数值。回归分析:就是对具有相关关系的两个或两个以回归分析:就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数
19、量变动关系的数学表达式,以变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。便对因变量进行估计或预测的统计分析方法。第29页,共55页,编辑于2022年,星期二关系:相关分析的主要任务是研究变量间相关关系关系:相关分析的主要任务是研究变量间相关关系的表现形式和密切程度,而回归分析是在相关分析的表现形式和密切程度,而回归分析是在相关分析的基础上,进一步研究现象之间的数量变化规律。的基础上,进一步研究现象之间的数量变化规律。变量变量x xi i与随机变量与随机变量y y的回归模型一般表示为的回归模型一般表示为“因变量因变量”或或“被解释变被解释变量量”(depen
20、dent variable)“解释变量解释变量”或或“自变自变量量”(independent variables)随机变量随机变量您知道您知道“回归回归”这个词的本来含义吗这个词的本来含义吗?第30页,共55页,编辑于2022年,星期二19世纪末,英国著名统计学家世纪末,英国著名统计学家Francis Galton研究孩子及研究孩子及他们父母的身高时发现,身材高的父母,他们的孩子也高,他们父母的身高时发现,身材高的父母,他们的孩子也高,但这些孩子平均起来并不像他们的父母那样高;对于比较矮但这些孩子平均起来并不像他们的父母那样高;对于比较矮的父母,他们的孩子比较矮,但这些孩子的平均身高要比他的父
21、母,他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。们的父母的平均身高高。Galton把这种孩子的身高向中间把这种孩子的身高向中间值靠近的趋势称之为一种回归效应。回归这个术语便值靠近的趋势称之为一种回归效应。回归这个术语便开始传播开来。开始传播开来。现在的回归分析已经没有原来的含义,但这种说法一直沿现在的回归分析已经没有原来的含义,但这种说法一直沿袭下来,重在表明这是研究数值变量之间关系的方法。袭下来,重在表明这是研究数值变量之间关系的方法。“回归回归”的本来含义的本来含义第31页,共55页,编辑于2022年,星期二 二、回归分析的主要内容 1.根据研究目的和现象之间的内在联
22、系,根据研究目的和现象之间的内在联系,确确 定自变量和因变量定自变量和因变量2.确定回归分析模型的类型及数学表达式确定回归分析模型的类型及数学表达式3.对回归分析模型进行评价与诊断对回归分析模型进行评价与诊断4.根据给定的自变量数值确定因变量的数值根据给定的自变量数值确定因变量的数值第32页,共55页,编辑于2022年,星期二 三、回归分析的特点 1.回归分析必须根据研究目的确定其中一个为回归分析必须根据研究目的确定其中一个为因变量,其余为自变量而相关分析可以不用区分因变量,其余为自变量而相关分析可以不用区分自变量和因变量自变量和因变量2.相关分析中,两个变量要求都是随机的,而在回相关分析中,
23、两个变量要求都是随机的,而在回归分析中,要求因变量是随机的,而自变量的值则归分析中,要求因变量是随机的,而自变量的值则是给定的是给定的3.若变量之间互为因果,则可以求出两个回归方程若变量之间互为因果,则可以求出两个回归方程,而两个变量之间只能求出一个相关系数而两个变量之间只能求出一个相关系数4.回归方程有较强的应用性回归方程有较强的应用性第33页,共55页,编辑于2022年,星期二四、回归模型的类型四、回归模型的类型一个自变量一个自变量一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性回线性回
24、归归非线性非线性回归回归线性回线性回归归非线性非线性回归回归第34页,共55页,编辑于2022年,星期二第四节第四节回归分析的模型回归分析的模型 一、简单线性回归模型一、简单线性回归模型 二、多元线性回归模型二、多元线性回归模型三、非线性回归模型三、非线性回归模型第35页,共55页,编辑于2022年,星期二 一、简单线性回归分析(一)简单线性回归模型(一)简单线性回归模型 理论模型理论模型估计模型估计模型回归参数回归参数回归参数的估计值回归参数的估计值 两点说明:两点说明:1.a是直线的截距,是直线的截距,b是直线的斜率是直线的斜率 2.因变量因变量y的估计值的估计值记为记为yc误差项误差项
25、第36页,共55页,编辑于2022年,星期二(二)参数估计销售额销售额wwwwwwwwwwThe question is:Which straight line fits best?思路:思路:离差的平方和最小离差的平方和最小最小二乘法最小二乘法第37页,共55页,编辑于2022年,星期二整理得整理得:最后解得:最后解得:设估计模型为设估计模型为第38页,共55页,编辑于2022年,星期二斜率斜率b的含义为:自变量的含义为:自变量x每增加(或减少)每增加(或减少)一个单位,因变量一个单位,因变量y将将平均平均平均平均增加(或减少)增加(或减少)b个个单位。单位。第39页,共55页,编辑于202
26、2年,星期二例:某企业对车例:某企业对车间间9名学徒工进行名学徒工进行调查,得到学徒调查,得到学徒期限与每天产量期限与每天产量情况如右表所示,情况如右表所示,要求建立以日产要求建立以日产量为因变量的回量为因变量的回归方程。归方程。所以回归方程为所以回归方程为yc=0.83+87.5x第40页,共55页,编辑于2022年,星期二斜率斜率b的其他公式的其他公式回归系数回归系数b和相关系数和相关系数r是有联系的是有联系的 第41页,共55页,编辑于2022年,星期二(三)回归估计标准误在散点图上可以拟合一条与各观测点配合最佳的直线,在散点图上可以拟合一条与各观测点配合最佳的直线,但这些观测点所代表的
27、若干对观测值,只是从总体中抽取但这些观测点所代表的若干对观测值,只是从总体中抽取的一个样本。由观测值求出的回归直线称为样本回归直线,的一个样本。由观测值求出的回归直线称为样本回归直线,它只是总体回归直线的一个估计线,因此在做回归分析时它只是总体回归直线的一个估计线,因此在做回归分析时需要对拟合的回归方程的代表性进行衡量。需要对拟合的回归方程的代表性进行衡量。估计误差的大小能反映估计值的准确性。但实际估计误差的大小能反映估计值的准确性。但实际值值y与估计值与估计值y yc c离差之和为离差之和为0,因为正离差与负离差抵因为正离差与负离差抵消了。显然离差的平方和可以衡量准确性消了。显然离差的平方和
28、可以衡量准确性 第42页,共55页,编辑于2022年,星期二 n-2为自由度,这是因为按最小二乘法求解两个参数为自由度,这是因为按最小二乘法求解两个参数a和和b,受到两个正规方程的约束,失去了两个自由度。,受到两个正规方程的约束,失去了两个自由度。离差平方和的平均数称为剩余方差,即离差平方和的平均数称为剩余方差,即对剩余方差开方即得对剩余方差开方即得回归估计标准误回归估计标准误,又称估计,又称估计标准误差标准误差,即,即第43页,共55页,编辑于2022年,星期二1.变差的产生变差的产生在在直直线线回回归归中中,因因变变量量y的的大大小小取取值值是是不不同同的的,它它围围绕绕平平均均值值上上下
29、下波波动动。y 取取值值的的这这种种波波动动称称为为变变差差。变变差差来来源源于于两两个个方方面面:一一是是由由于于自自变变量量 x 的的取取值值不不同同造造成成的的;二二是是除除 x 以以外外的的其其他他因因素素(如如x对对y的的非非线线性性影响、测量误差等影响、测量误差等)的影响造成的。的影响造成的。(四)回归方程判定系数第44页,共55页,编辑于2022年,星期二两边平方得两边平方得两边求和并两边求和并化简得化简得第45页,共55页,编辑于2022年,星期二2.变差的分解变差的分解反映由于反映由于 x 与与 y 之间的线性关系引起的之间的线性关系引起的 y 的取值变的取值变化,也称可解释
30、的变差。化,也称可解释的变差。回归变差回归变差回归变差回归变差(SSRSSR)TSS=SSR+SSE总变差总变差总变差总变差(TSSTSS)剩余变差剩余变差剩余变差剩余变差或残差或残差或残差或残差(SSESSE)第46页,共55页,编辑于2022年,星期二回归变差占总变差的比例,称为判定系数。回归变差占总变差的比例,称为判定系数。*也称可决系数或确定系数。是反映回归直线的拟合优度的也称可决系数或确定系数。是反映回归直线的拟合优度的也称可决系数或确定系数。是反映回归直线的拟合优度的也称可决系数或确定系数。是反映回归直线的拟合优度的统计指标。统计指标。统计指标。统计指标。R R2 2 1 1,说明
31、回归方程拟合得越好;,说明回归方程拟合得越好;,说明回归方程拟合得越好;,说明回归方程拟合得越好;R R2 20 0,说明回归方程拟合越差。,说明回归方程拟合越差。,说明回归方程拟合越差。,说明回归方程拟合越差。*R R2 2的取值范围在的取值范围在的取值范围在的取值范围在 0,1 0,1 之间,在一元线形模型中,判之间,在一元线形模型中,判之间,在一元线形模型中,判之间,在一元线形模型中,判定定定定系数就等于相关系数的平方,即系数就等于相关系数的平方,即系数就等于相关系数的平方,即系数就等于相关系数的平方,即R R2 2r r2 23.判定系数判定系数第47页,共55页,编辑于2022年,星
32、期二在大样本条件下,在大样本条件下,第48页,共55页,编辑于2022年,星期二(五)回归方程的统计检验1、模型整体拟合效果的显著性检验、模型整体拟合效果的显著性检验 在给定显著性水平之下,若:在给定显著性水平之下,若:则拒绝原假设,认为回归方程整体是显著的。则拒绝原假设,认为回归方程整体是显著的。第49页,共55页,编辑于2022年,星期二2、模型参数显著性的检验、模型参数显著性的检验 模型参数显著性检验主要是判断每一个自变量对模型参数显著性检验主要是判断每一个自变量对于回归模型是否必要的。于回归模型是否必要的。一元线性回归模型截距和斜率的显著性检验方法一元线性回归模型截距和斜率的显著性检验
33、方法第50页,共55页,编辑于2022年,星期二(六)因变量的置信区间估计(六)因变量的置信区间估计 意义:根据回归估计标准误进一步对因变量意义:根据回归估计标准误进一步对因变量意义:根据回归估计标准误进一步对因变量意义:根据回归估计标准误进一步对因变量y y进行进行进行进行估计或推断,确定估计或推断,确定估计或推断,确定估计或推断,确定y y的回归估计置信区间。的回归估计置信区间。的回归估计置信区间。的回归估计置信区间。两个假设:两个假设:两个假设:两个假设:y y的实际观测值在估计值周围呈正态分布即的实际观测值在估计值周围呈正态分布即的实际观测值在估计值周围呈正态分布即的实际观测值在估计值
34、周围呈正态分布即正态性;所有的正态分布具有相同的标准差,即同方差正态性;所有的正态分布具有相同的标准差,即同方差正态性;所有的正态分布具有相同的标准差,即同方差正态性;所有的正态分布具有相同的标准差,即同方差性。性。性。性。估计区间估计区间第51页,共55页,编辑于2022年,星期二二、多元线性回归模型二、多元线性回归模型 多元线性回归的一般方程式为:多元线性回归的一般方程式为:同样根据最小二乘法原理,可得:同样根据最小二乘法原理,可得:一般都要用统计软件来计算参数一般都要用统计软件来计算参数 第52页,共55页,编辑于2022年,星期二三、非线性回归模型三、非线性回归模型 对于非线性回归,通
35、常采用变量代换法将非线性模型对于非线性回归,通常采用变量代换法将非线性模型线性化,从而将曲线回归问题转化为线性回归问题,线性化,从而将曲线回归问题转化为线性回归问题,再按照线性模型的方法来处理。再按照线性模型的方法来处理。1 1、指数曲线模型、指数曲线模型 2、对数曲线模型、对数曲线模型 3、双曲线模型、双曲线模型 4、幂函数曲线模型、幂函数曲线模型 5、抛物线模型、抛物线模型 第53页,共55页,编辑于2022年,星期二1、正正相相关关是是指指自自变变量量和和因因变变量量的的数数量量变变动动方方向向都都是是上上升升的。的。2、回回归归系系数数b和和相相关关系系数数r都都可可以以用用来来判判断
36、断现现象象之之间间相关的密切程度。相关的密切程度。3、在在相相关关分分析析中中,要要求求两两个个变变量量都都是是随随机机的的;在在回回归分析中,要求两个变量都不是随机的。归分析中,要求两个变量都不是随机的。4、判判定定系系数数越越大大,估估计计标标准准误误就就越越大大;判判定定系系数数越越小小,估计标准误就越小。估计标准误就越小。5、利用最小二乘法拟合的直线回归方程,要求所有、利用最小二乘法拟合的直线回归方程,要求所有观测点和回归直线的距离平方和为零。观测点和回归直线的距离平方和为零。概念辨析概念辨析第54页,共55页,编辑于2022年,星期二OK!This chapter is over.第55页,共55页,编辑于2022年,星期二