测量数据处理第1章.ppt

上传人:wuy****n92 文档编号:88519160 上传时间:2023-04-26 格式:PPT 页数:87 大小:4MB
返回 下载 相关 举报
测量数据处理第1章.ppt_第1页
第1页 / 共87页
测量数据处理第1章.ppt_第2页
第2页 / 共87页
点击查看更多>>
资源描述

《测量数据处理第1章.ppt》由会员分享,可在线阅读,更多相关《测量数据处理第1章.ppt(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2023/4/251实用测量数据处理方法实用测量数据处理方法王磊王磊电话电话邮箱邮箱东南大学交通学院测绘工程系东南大学交通学院测绘工程系2023/4/252第一章第一章回归分析回归分析第二章第二章插值与拟合插值与拟合第三章第三章稳健估计稳健估计第四章第四章时间序列分析时间序列分析第五章第五章傅立叶分析傅立叶分析第六章第六章有限元方法有限元方法第七章第七章分布拟合检验分布拟合检验主要内容主要内容研究背景研究背景一是实用意义,(一是实用意义,(1 1)掌握各种建筑物和地质构造的)掌握各种建筑物和地质构造的稳定性,为安全性诊断提供必要的信息,以便及时发稳定性,为安全性诊断提供必要的信息,以便及时发现

2、问题并采取相应的对策和措施,防止灾害的发生或现问题并采取相应的对策和措施,防止灾害的发生或最大限度地减少灾害造成的损失;如:最大限度地减少灾害造成的损失;如:汶川地震中唐汶川地震中唐家山堰塞湖泄洪问题家山堰塞湖泄洪问题、三峡大坝蓄水、古建筑的保三峡大坝蓄水、古建筑的保护等。(护等。(2)生活及国防需要,如工厂生产过程的调)生活及国防需要,如工厂生产过程的调度、证券分析、奖学金的评定;飞机机场的控制模型,度、证券分析、奖学金的评定;飞机机场的控制模型,飞机、坦克及各种航天器外形的建模设计等。飞机、坦克及各种航天器外形的建模设计等。二是科学意义,包括更好地理解变形的机理,验证有二是科学意义,包括更

3、好地理解变形的机理,验证有关工程设计的理论和地壳运动的假说,进行反馈设计关工程设计的理论和地壳运动的假说,进行反馈设计以及建立有效的变形预报模型。以及建立有效的变形预报模型。广东九江大桥广东九江大桥200米桥面被撞垮塌米桥面被撞垮塌吉林吉林23亿铁路工程成亿铁路工程成“豆腐渣豆腐渣”南京南京*大桥大桥2011-2上虞立交桥坍塌上虞立交桥坍塌昆昆明明在在建建新新机机场场立立交交桥桥垮垮塌塌西安明城墙西安明城墙南京明城墙南京明城墙上海楼倒倒上海楼倒倒上海楼倒倒上海楼倒倒楼歪歪楼歪歪楼碰碰楼碰碰楼轻轻楼轻轻西安惊现纸做墙壁西安惊现纸做墙壁2023/4/2520第一章第一章 回归分析回归分析第一节第一

4、节概述概述第二节一元线性回归分析第二节一元线性回归分析第三节多元线性回归分析第三节多元线性回归分析第四节最优回归模型的选择第四节最优回归模型的选择第五节第五节可化为线性回归模型的非线性回归可化为线性回归模型的非线性回归第六节第六节第二类非线性回归第二类非线性回归2023/4/2521第一节第一节 概述概述 现实世界中的各种现象之间相互联系、相互制约、相互现实世界中的各种现象之间相互联系、相互制约、相互依存,某些现象发生变化时,另一现象也随之发生变化。依存,某些现象发生变化时,另一现象也随之发生变化。如商品价格的变化会刺激或抑制商品销售量的变化;劳如商品价格的变化会刺激或抑制商品销售量的变化;劳

5、动力素质的高低会影响企业的效益;直接材料、直接人工的动力素质的高低会影响企业的效益;直接材料、直接人工的价格变化对产品销售成本有直接的影响,居民收入的高低会价格变化对产品销售成本有直接的影响,居民收入的高低会影响对该企业产品的需求量等等。影响对该企业产品的需求量等等。研究这些现象之间的依存关系,找出它们之间的变化规研究这些现象之间的依存关系,找出它们之间的变化规律,是对经搜集、整理过的统计数据进行数据分析,为客观、律,是对经搜集、整理过的统计数据进行数据分析,为客观、科学地统计提供依据。科学地统计提供依据。现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可以分成两种类型:一类是函一类

6、是函数关系,另一类是相关关系。数关系,另一类是相关关系。2023/4/25221.函数关系函数关系当一个或几个变量取一定的值当一个或几个变量取一定的值时,另一个变量有确定值与之时,另一个变量有确定值与之相对应,我们称这种关系为确相对应,我们称这种关系为确定性的函数关系。定性的函数关系。一、函数关系与相关关系一、函数关系与相关关系2023/4/2523(函数关系)(函数关系)(1)是一一对应的确定关系)是一一对应的确定关系(2)设设有有两两个个变变量量x 和和y,变变量量y 随随变变量量x 一一起起变变化化,并并完完全全依依赖赖于于x,当当变变量量x 取取某某个个数数值值时时,y 依依确确定定的

7、的关关系系取取相相应应的的值值,则则称称y 是是x 的的函函数数,记记为为y=f(x),其其中中x 称称为为自自变变量,量,y 称为因变量称为因变量(3)各观测点落在一条线上)各观测点落在一条线上 x xy y2023/4/2524变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的的关关系可表示为系可表示为y=p x(p 为单价为单价)圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示示为为S=r2 企企业业的的原原材材料料消消耗耗额额(y)与与产产量量(x1)、单单位位产产量量消消耗

8、耗(x2)、原原材材料料价价格格(x3)之之间间的的关关系系可可表示为表示为y=x1x2x3 2023/4/25252.2.相关关系:相关关系:当一个或几个相互联系的当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。律在一定的范围内变化。现象之间客观存在的不严格、不确现象之间客观存在的不严格、不确定的数量依存关系。定的数量依存关系。2023/4/2526变量间的关系变量间的关系(相关关系)(相关关系)(1)变变量量间间关关系系不不能能用用函函数数关关系精确表达;系精

9、确表达;(2)一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定;一个变量唯一确定;(3)当当变变量量x 取取某某个个值值时时,变变量量y 的取值可能有几个;的取值可能有几个;(4)各观测点分布在直线周围。)各观测点分布在直线周围。x xy y2023/4/2527相关关系的例子相关关系的例子商品的消费量商品的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系商品的消费量商品的消费量(y)与物价与物价(x)之间的关系之间的关系商品销售额商品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温

10、度温度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系2023/4/2528 确定性关系和相关关系之间没有一道不可确定性关系和相关关系之间没有一道不可逾越的鸿沟,由于测量误差等原因,确定性关逾越的鸿沟,由于测量误差等原因,确定性关系在实际中往往通过相关关系表现出来;当对系在实际中往往通过相关关系表现出来;当对事物的内部规律了解得更加深刻的时候,相关事物的内部规律了解得更加深刻的时候,相关关系有可能转化为确定性关系。关系有可能转化为确定性关系。2023/4/2529二、回归分析

11、二、回归分析1回归分析回归分析是指对具有相关关系的现象,根据是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式)合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变,用来近似地表达变量间的平均变化关系的一种统计分析方法。化关系的一种统计分析方法。2回归分析应用回归分析应用工程建筑物的变形分析、自然工程建筑物的变形分析、自然灾害破坏性的预报、地震的预灾害破坏性的预报、地震的预测、工厂生产的调度、飞机、测、工厂生产的调度、飞机、坦克及各种航天器外形的建模坦克及各种航天器外形的建模设计等。设计等。2023/4/25303

12、回归分析回归分析主要内容和步骤主要内容和步骤2023/4/2531 回归分析和相关分析是研究相关关系的一种数学工具,回归分析和相关分析是研究相关关系的一种数学工具,相关分析相关分析是把变量都看做随机变量,其目的是确定变量之间的是把变量都看做随机变量,其目的是确定变量之间的相互联系的程度如何,分析中假定所有随机变量的误差都呈正相互联系的程度如何,分析中假定所有随机变量的误差都呈正态分布。态分布。回归分析回归分析则是应用数学方法对大量观测数据加以处理,则是应用数学方法对大量观测数据加以处理,从而求出非确定性关系的变量之间的关系规律性,并用数学关从而求出非确定性关系的变量之间的关系规律性,并用数学关

13、系式表达出来。在回归分析中,假定因变量的误差呈正态分布,系式表达出来。在回归分析中,假定因变量的误差呈正态分布,而对自变量的误差分布并无要求,也就是只考虑在自变量保持而对自变量的误差分布并无要求,也就是只考虑在自变量保持一系列定值时,因变量这个随机变量是如何变化的。一系列定值时,因变量这个随机变量是如何变化的。2023/4/2532回归分析的主要内容。利用回归分析能解决的问题可归回归分析的主要内容。利用回归分析能解决的问题可归纳为下述五个内容:纳为下述五个内容:1 1、经验公式、经验公式 根据实验数据,求取变量之间相关的定量关系式;根据实验数据,求取变量之间相关的定量关系式;2 2、可信性检验

14、、可信性检验 对求得经验公式的可信性进行统计检验;对求得经验公式的可信性进行统计检验;3 3、预报和控制、预报和控制 利用求得的经验公式根据取得或确定的数值,预测或控利用求得的经验公式根据取得或确定的数值,预测或控制其它变量的取值,并对预报和控制的结果,进行可信制其它变量的取值,并对预报和控制的结果,进行可信程度的评定;程度的评定;2023/4/25334 4、因素分析、因素分析 从影响某一变量的许多变量中,判断哪些变量影从影响某一变量的许多变量中,判断哪些变量影响显著;哪些变量不显著;哪些变量没有影响;响显著;哪些变量不显著;哪些变量没有影响;5 5、实验方案的设计、实验方案的设计 根据实验

15、的目的和对实验结果的精度要求,考虑根据实验的目的和对实验结果的精度要求,考虑回归分析对数据的要求,主动的安排实验方案,使设回归分析对数据的要求,主动的安排实验方案,使设计出的实验方案,能够用较少的实验次数,获取最大计出的实验方案,能够用较少的实验次数,获取最大的信息量,并能使获得的实验数据具有较好的统计性的信息量,并能使获得的实验数据具有较好的统计性质,便于回归分析的数据处理。质,便于回归分析的数据处理。2023/4/2534首先根据理论和对问题的分析判断,找出自变量和首先根据理论和对问题的分析判断,找出自变量和因变量;其次,设法找出合适的数学方程式(即回因变量;其次,设法找出合适的数学方程式

16、(即回归模型)描述变量间的关系;由于涉及到的变量具归模型)描述变量间的关系;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;有不确定性,接着还要对回归模型进行统计检验;统计检验通过后,最后是利用回归模型,根据自变统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。量去估计、预测因变量。回归分析回归分析主要步骤主要步骤2023/4/2535三、回归模型与回归方程三、回归模型与回归方程2023/4/2536回归模型的类型回归模型的类型一个自变量一个自变量一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多

17、元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归2023/4/2537一元线性回归模型一元线性回归模型(概念要点)(概念要点)1.当当只只涉涉及及一一个个自自变变量量时时称称为为一一元元回回归归,若若因因变变量量y 与与自自变变量量x 之之间间为为线线性性关关系系时时称称为为一一元元线线性回归。性回归。2.对对于于具具有有线线性性关关系系的的两两个个变变量量,可可以以用用一一条条线线性方程来表示它们之间的关系。性方程来表示它们之间的关系。3.描描述述因因变变量量y 如如何何依依赖赖于于自自变变量量x 和和误误差差项项 的方程称为的方程称为回

18、归模型。回归模型。2023/4/2538一元线性回归模型一元线性回归模型对对于于只只涉涉及及一一个个自自变变量量的的简简单单线线性性回回归归模模型型可可表表示示为为 yt=0 0+1 1 x+i模型中,模型中,y 是是x 的线性函数的线性函数(部分部分)加上误差项加上误差项线性部分反映了由于线性部分反映了由于x 的变化而引起的的变化而引起的y 的变化的变化误差项误差项 i是随机变量是随机变量反反映映了了除除x 和和y 之之间间的的线线性性关关系系之之外外的的随随机机因因素对素对y 的影响的影响是是不不能能由由x 和和y 之之间间的的线线性性关关系系所所解解释释的的变变异异性性 0和和 1称为模

19、型的参数称为模型的参数2023/4/2539多元线性回归模型多元线性回归模型一个因变量与两个及两个以上自变量之间的回归一个因变量与两个及两个以上自变量之间的回归描述因变量描述因变量y 如何依赖于自变量如何依赖于自变量x1,x2,xp和和误差项误差项 的方程称为多元线性回归模型的方程称为多元线性回归模型涉及涉及p个自变量的多元线性回归模型可表示为个自变量的多元线性回归模型可表示为 0 ,1 1,2 2,p是参数(是参数(回归系数)回归系数)是被称为误差项的随机变量是被称为误差项的随机变量 y 是是x1,,x2 ,xp 的线性函数加上误差项的线性函数加上误差项 说说明明了了包包含含在在y里里面面但

20、但不不能能被被p个个自自变变量量的的线线性关系所解释的变异性性关系所解释的变异性2023/4/2540多元线性回归模型多元线性回归模型对对于于n 组组实实际际观观察察数数据据(yi;xi1,,xi2 ,xip),(i=1,2,n),多多元元线线性性回回归归模模型可表示为型可表示为y1=0 0+1 1 x11+2 2 x12+px1p+1 1y2=0 0+1 1 x21+2 2 x22+px2p+2 2 yn=0 0+1 1 xn1+2 2 xn2+pxnp+n 2023/4/2541第二节 一元线性回归分析一、一元线性回归参数的最小二乘估计一、一元线性回归参数的最小二乘估计1、一元线性回归模型

21、和回归方程、一元线性回归模型和回归方程:y=0 0+1 1 x (1.2.1)y=0 0+1 1 xi+i (1.2.2)0和和 1为未知的回归参数为未知的回归参数假定假定:i是服从正态分布是服从正态分布,又假定又假定x是非随机变量,因此观测值是非随机变量,因此观测值y的方差也为的方差也为2,且,且yi与与yj()也是互相独立的。)也是互相独立的。2023/4/2542对对n个观测值个观测值yi由(由(1.2.2)式可构成式可构成y=A+,N(0,I)(1.2.3)(1.2.4)依最小二乘估计法由依最小二乘估计法由(1.2.4)求求,即在,即在的要求下求定的要求下求定2023/4/2543将(

22、将(1.2.4)代入上式,可得法方程(正规方程)代入上式,可得法方程(正规方程)2023/4/25442023/4/25452023/4/2546二、估值的若干性质二、估值的若干性质1、无偏性、无偏性2023/4/25472023/4/25486、残差平方和(记为、残差平方和(记为)2023/4/25492023/4/2550三、一元回归的方差分析和线性关系的显著性检验三、一元回归的方差分析和线性关系的显著性检验 回归直线方程式求出来了,但它是否有实际意义呢回归直线方程式求出来了,但它是否有实际意义呢?这里有两个问题需要解决:其一,就这种求回归直线?这里有两个问题需要解决:其一,就这种求回归直

23、线的方法本身而言,对任何两个变量的方法本身而言,对任何两个变量x x和和y y的一组数据的一组数据(xi,yi),i=1,2,N,xi,yi),i=1,2,N,都可以用最小二乘法给他们拟合都可以用最小二乘法给他们拟合一条直线。要知道这条直线是否基本上符合一条直线。要知道这条直线是否基本上符合y y与与x x之间的之间的客观规律,这就是回归方程的显著性检验要解决的问题。客观规律,这就是回归方程的显著性检验要解决的问题。其二,由于其二,由于x x与与y y之间是相关关系,知道了之间是相关关系,知道了x x值,并不能精值,并不能精确地知道确地知道y y值,那么,用回归方程,根据自变量值,那么,用回归

24、方程,根据自变量x x值预报值预报(或控制)因变量(或控制)因变量y y值,其效果如何?这就是回归直线的值,其效果如何?这就是回归直线的预报精度问题。为此,必须对回归问题作进一步分析。预报精度问题。为此,必须对回归问题作进一步分析。2023/4/2551现介绍一种常用的方差分析方法,其实质是对现介绍一种常用的方差分析方法,其实质是对N个观测个观测值与其算术平均值之差的平方和进行分解,将对值与其算术平均值之差的平方和进行分解,将对N个观测值个观测值的影响因素从数量上区别开,然后用的影响因素从数量上区别开,然后用F检验法对所求的回归检验法对所求的回归方程进行显著性检验。方程进行显著性检验。1、回归

25、方程的方差分析、回归方程的方差分析观测值观测值y1,y2,yn之间的差异(称变差),是由两个方之间的差异(称变差),是由两个方面原因引起的:(面原因引起的:(1)自变量)自变量x取值的不同;(取值的不同;(2)其他因素)其他因素(包括试验误差)的影响。为了对回归方程进行检验,首先(包括试验误差)的影响。为了对回归方程进行检验,首先必须把它们所引起的变差从必须把它们所引起的变差从y的总变差中分离出来。的总变差中分离出来。N个观测值之间的变差,可用观测值个观测值之间的变差,可用观测值y与其算术平均值的离差与其算术平均值的离差平方和来表示,称为总的离差平方和,记作平方和来表示,称为总的离差平方和,记

26、作2023/4/25522023/4/2553见下图见下图这样,通过平方和分解式就把这样,通过平方和分解式就把N个观测值的两种影响从数个观测值的两种影响从数量上区分开来。量上区分开来。2023/4/25542023/4/25552、回归方程的显著性检验、回归方程的显著性检验回归方程显著性是表征变量回归方程显著性是表征变量y与与x的线性关系的密切程度的的线性关系的密切程度的指标。由回归平方和和残余平方和的含义可以知道,在离差平指标。由回归平方和和残余平方和的含义可以知道,在离差平方和一定的前提下,变量方和一定的前提下,变量y与与x的线性关系是否密切,完全取决的线性关系是否密切,完全取决于于值和值

27、和值。值。值越大,值越大,越小,说明越小,说明y与与x的线性关的线性关系越密切。回归方程显著性的检验,通常采用所谓系越密切。回归方程显著性的检验,通常采用所谓F检验法,检验法,即计算统计量。即计算统计量。2023/4/25562023/4/2557四、样本相关系数四、样本相关系数 r r 在统计研究中,对现象间的相关关系的密切程度用相关系数在统计研究中,对现象间的相关关系的密切程度用相关系数或相关指数来确定。样本相关系数或相关指数来确定。样本相关系数r r,它是衡量两个变量之间线,它是衡量两个变量之间线性相关关系的重要指标,由于这个系数是由英国统计学家皮尔逊性相关关系的重要指标,由于这个系数是

28、由英国统计学家皮尔逊(Pearson)(Pearson)设计的,故又称为设计的,故又称为PearsonPearson相关系数。相关系数。设研究总体有N对(),我们可以计算出对应的均值 和 ,通过点(,)画两条平行于X轴和Y轴的直线,将散点图分成四个部分,见图2023/4/2558 当X和Y是正相关时,观测点大多数散布在、部分,较大且为正值。当X与Y呈负相关时,观测点大多数散布在、部分,值较大但为负值。当X与Y不相关或低度相关时,各观测点不规则地散布在四个部分,在各象限的值正负互相抵消,最终其值会很小或趋于零。因此 可用来衡量X与Y的相关方向与程度,值大表示变量间关系密切,值小表示变量间关系不密

29、切。2023/4/2559但 的值与X与Y的计量单位及X和Y自身的变异程度都有关,为了使不同总体的相关系数可以互相对比,将 除以X与Y的标准差、以消除变量值大小和离差值大小不等的影响,这样得到一个抽象系数r r,称为总体直线相关系数,即:样本相关系数是根据样本观测值计算的,抽取的样本不同,其具体的数值也会有所差异。容易证明,样本相关系数是总体相关系数的一致(无偏)估计量。2023/4/25602023/4/2561样本相关系数样本相关系数有以下特点:有以下特点:1.的取值介于与之间。的取值介于与之间。2.当当时,与的样本观测值之间没有线性关系。时,与的样本观测值之间没有线性关系。3.在大多数情

30、况下,在大多数情况下,即,即与与的样本观测的样本观测值之间存在着一定的线性关系,当值之间存在着一定的线性关系,当时,与为正相关,时,与为正相关,当当时,时,与与为负相关。为负相关。4.如果如果,则表明,则表明与与完全线性相关,当完全线性相关,当时,称为完全正相关,而时,称为完全正相关,而时,称为完全负相关。时,称为完全负相关。5.是对变量之间线性相关关系的度量。是对变量之间线性相关关系的度量。只是表明两只是表明两个变量之间不存在线性关系,它并不意味着个变量之间不存在线性关系,它并不意味着与与之间不存在之间不存在其他类型的关系。对于二者之间可能存在的非线性相关关系,其他类型的关系。对于二者之间可

31、能存在的非线性相关关系,需要利用其他指标去进行分析。需要利用其他指标去进行分析。2023/4/2562r r检验检验2023/4/2563第三节 多元线性回归分析一、多元线性回归参数的最小二乘估计一、多元线性回归参数的最小二乘估计1、多元线性回归模型和回归方程、多元线性回归模型和回归方程:i是相应于是相应于的随机误差,假定的随机误差,假定又假定又假定xi是非随机变量,因此观测值是非随机变量,因此观测值的方差也为的方差也为2,且,且yi与与yj 也是互相独立的。也是互相独立的。2023/4/2564若记若记2023/4/2565多元线性回归模型的基本假定多元线性回归模型的基本假定为了保证模型参数

32、估计的正确性,对回归方程做如下基本假定:为了保证模型参数估计的正确性,对回归方程做如下基本假定:(1)(1)变量变量xixi 是确定性变量,不是随机变量。是确定性变量,不是随机变量。(2)(2)随机误差项具有零均值和同方差,即随机误差项具有零均值和同方差,即(3)(3)正态分布的假定条件:正态分布的假定条件:由上述假定和多元正态分布的性质可知:由上述假定和多元正态分布的性质可知:Y Y仍遵从仍遵从n n维正态分维正态分布,且布,且 2023/4/2566按最小二乘估计法由上式求未知的多元回归参数的估值按最小二乘估计法由上式求未知的多元回归参数的估值,也就是在,也就是在的要求下求定的要求下求定2

33、023/4/2567将(将(1.3.4)代入上式,可得法方程(正规方程)代入上式,可得法方程(正规方程)2023/4/25682023/4/2569二、参数的中心化解二、参数的中心化解2023/4/2570将将(1.3.13)式代入式代入(1.3.7)式中的其它各式,则可以式中的其它各式,则可以得到中心化法方程得到中心化法方程2023/4/25712023/4/2572三、多元线性回归统计性质三、多元线性回归统计性质2023/4/25732023/4/25742023/4/2575四、多元线性回归的方差分析和显著性检验四、多元线性回归的方差分析和显著性检验1、方差分析:由离差平方和的分解公式可

34、知,回归模型的总离、方差分析:由离差平方和的分解公式可知,回归模型的总离差平方和等于回归平方和与残差平方和的和。差平方和等于回归平方和与残差平方和的和。2023/4/25762 2、显著性检验(、显著性检验(F F检验法)检验法)对多元线性回归方程,必须检验对多元线性回归方程,必须检验X X和和Y Y之间是否存在线性相之间是否存在线性相关问题。一个很自然的想法就是把回归平方和关问题。一个很自然的想法就是把回归平方和 (线性影响)(线性影响)跟剩余平方和跟剩余平方和 (其他影响)进行比较。由于回归平方和与(其他影响)进行比较。由于回归平方和与残差平方和的数值会随观测值的样本容量和自变量个数的不同

35、残差平方和的数值会随观测值的样本容量和自变量个数的不同而变化,因此不宜直接比较,而必须在方差分析的基础上利用而变化,因此不宜直接比较,而必须在方差分析的基础上利用检验进行。检验进行。2023/4/2577多元回归中进行这一检验的目的主要是为了检验与各回归系多元回归中进行这一检验的目的主要是为了检验与各回归系数对应的自变量对因变量的影响是否显著,以便对自变量的取数对应的自变量对因变量的影响是否显著,以便对自变量的取舍做出正确的判断。一般来说,当发现某个自变量的影响不显舍做出正确的判断。一般来说,当发现某个自变量的影响不显著时,应将其从模型中删除。这样才能够做到以尽可能少的自著时,应将其从模型中删

36、除。这样才能够做到以尽可能少的自变量去达到尽可能高的拟合优度。变量去达到尽可能高的拟合优度。多元模型中回归系数的检验同样采用检验,其原理和基多元模型中回归系数的检验同样采用检验,其原理和基本步骤与一元回归模型中的检验基本相同,这里不再赘述。本步骤与一元回归模型中的检验基本相同,这里不再赘述。下面仅给出回归系数显著性检验统计量的一般计算公式下面仅给出回归系数显著性检验统计量的一般计算公式五、回归系数的显著性检验五、回归系数的显著性检验2023/4/25782023/4/2579六、多元回归的预测六、多元回归的预测2023/4/25802023/4/25812023/4/2582第四节第四节 最优

37、回归模型的选择最优回归模型的选择一、最优回归模型的选择准则一、最优回归模型的选择准则2023/4/2583二、全面比较法二、全面比较法对自变量各种不同的组合所建立的回归对自变量各种不同的组合所建立的回归方程进行比较方程进行比较 择优。择优。2023/4/2584三、向前法与向后法三、向前法与向后法1.向前法向前法,回归方程中的自变量从无到有、从少到多逐个引入,回归方程中的自变量从无到有、从少到多逐个引入回归方程。回归方程。此法已基本淘汰此法已基本淘汰。2.向后法向后法,先将全部自变量选入方程,然后逐步剔除无统计,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量(对学意义的自变量(对影响

38、较小的自变量)影响较小的自变量)。剔除自变量的方法是在方程中选一个偏回归平方和最小的剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。采用此法。四.逐步回归法,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。2023/4/2585第五节第五节 可化为线性回归模型的非线性回归可化为线性回归模型的非线性回归 第一类非线性回归第一类非线性回归2023/4/25862023/4/2587

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁