《概率论与数理统计第九章精选课件.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第九章精选课件.ppt(155页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于概率论与数理统计第九章1第一页,本课件共有155页2n方差分析方差分析(Analysis of variance,简称简称:ANOVA),是由英国统计学家费歇尔是由英国统计学家费歇尔(Fisher)在在20世纪世纪20年代提出的年代提出的,可用于推断两个或可用于推断两个或两个以上总体均值是否有差异的显著性两个以上总体均值是否有差异的显著性检验检验.第二页,本课件共有155页31单因素方差分析单因素方差分析例:为了比较三种不同类型日光灯管的寿命例:为了比较三种不同类型日光灯管的寿命(小时小时),现将从每种类型日光灯管中抽取现将从每种类型日光灯管中抽取 8个个,总共总共 24 个日光灯管进行老
2、化试验个日光灯管进行老化试验,根据下面经老化根据下面经老化试验后测算得出的各个日光灯管的寿命试验后测算得出的各个日光灯管的寿命(小时小时),试判断三种不同类型日光灯管的寿命是不是有试判断三种不同类型日光灯管的寿命是不是有存在差异存在差异.第三页,本课件共有155页4日光灯管的寿命日光灯管的寿命(小小时时)类型寿命(小时)类型I52906210574050005930612060805310类型II58405500598062506470599054705840类型.III71306660634064707580656072906730引起日光灯管寿命不同的原因有二个方面引起日光灯管寿命不同的原
3、因有二个方面:n其一其一,由于日光灯类型不同由于日光灯类型不同,而引起寿命不同而引起寿命不同.n其二其二,同一种类型日光灯管同一种类型日光灯管,由于其它随机因由于其它随机因素的影响素的影响,也使其寿命不同也使其寿命不同.第四页,本课件共有155页5n在方差分析中在方差分析中,通常把研究对象的特征值通常把研究对象的特征值,即所即所考察的试验结果考察的试验结果(例如日光灯管的寿命例如日光灯管的寿命)称为称为 试验指标试验指标.n对试验指标产生影响的原因称为对试验指标产生影响的原因称为 因素因素,“日光日光灯管类型灯管类型”即为即为因素因素.n因素中各个不同状态称为因素中各个不同状态称为 水平水平,
4、如日光灯管三如日光灯管三个不同的类型个不同的类型,即为三个即为三个水平水平.第五页,本课件共有155页6n单因素方差分析单因素方差分析 仅考虑有一个因素仅考虑有一个因素A对试验指对试验指标的影响标的影响.假如因素假如因素 A有有r 个水平个水平,分别在第分别在第 i 水平下进行了水平下进行了 多次独立观测多次独立观测,所得到的试验指所得到的试验指标的数据标的数据 第六页,本课件共有155页7每个总体相互独立每个总体相互独立.因此因此,可写成如下可写成如下的的 数学模型数学模型:第七页,本课件共有155页8n 方差分析的目的就是要比较因素方差分析的目的就是要比较因素A 的的r 个水平下试验指标理
5、论均值的个水平下试验指标理论均值的差异差异,问题可归结为比较这问题可归结为比较这r个总体个总体的均值差异的均值差异.第八页,本课件共有155页9检验假设检验假设第九页,本课件共有155页10假设等价于假设等价于第十页,本课件共有155页11n为给出上面的检验,主要采用的方法是平方和为给出上面的检验,主要采用的方法是平方和分解。即分解。即n假设数据总的差异用总离差平方和假设数据总的差异用总离差平方和 分解为分解为二个部分二个部分:一部分是由于因素一部分是由于因素 A引起的差异引起的差异,即即效应平方和效应平方和 ;另一部分则由随机误差所引另一部分则由随机误差所引起的差异,起的差异,即误差平方和即
6、误差平方和 。第十一页,本课件共有155页12第十二页,本课件共有155页13证明:第十三页,本课件共有155页14第十四页,本课件共有155页15第十五页,本课件共有155页16第十六页,本课件共有155页17第十七页,本课件共有155页18定理9.1.1第十八页,本课件共有155页19方差来源平方和自由度均方F比因素Ar-1误差n-r总和n-1单因素试验方差分析表单因素试验方差分析表第十九页,本课件共有155页20第二十页,本课件共有155页21例例1 设设有有5种种治治疗疗荨荨麻麻疹疹的的药药,要要比比较较它它们们的的疗疗效效。假假设设将将30个个病病人人分分成成5组组,每每组组6人人,
7、令令同同组组病病人人使使用用一一种种药药,并并记记录录病病人人从从使使用用药药物物开开始始到到痊痊愈愈所所需需时时间间,得到下面的记录:得到下面的记录:(=0.05)第二十一页,本课件共有155页22药物类型治愈所需天数x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6第二十二页,本课件共有155页23这里药物是因子,共有这里药物是因子,共有5 5个水平,这是个水平,这是一个单因素方差分析问题,要检验的一个单因素方差分析问题,要检验的假设是假设是“所有药物的效果都没有差别所有药物的效果都没有差别”。第二十三页,本课件共有
8、155页24第二十四页,本课件共有155页25方差来源 平方和 自由度均方F比因素A36.46749.1173.90误差58.500252.334总和94.96729第二十五页,本课件共有155页26未知参数的估计未知参数的估计第二十六页,本课件共有155页27第二十七页,本课件共有155页28第二十八页,本课件共有155页29第二十九页,本课件共有155页30在在Excel上实现方差分析上实现方差分析n先加载先加载数据分析数据分析 这个模块这个模块,方法如下方法如下:n在在excel工作表中点击主菜单中工作表中点击主菜单中“工具工具”点击下拉点击下拉式菜单中式菜单中“加载宏加载宏”就会出现一
9、个就会出现一个“加载宏加载宏”的的框框.n 在在“分析工具库分析工具库”前的框内打勾点击前的框内打勾点击“确定确定”.这时候再点击下拉式菜单会新出现这时候再点击下拉式菜单会新出现“数据分析数据分析”.然后就可以进行统计分析了然后就可以进行统计分析了.第三十页,本课件共有155页31以下面的例子来说明用以下面的例子来说明用Excel进行方差进行方差分析的方法分析的方法:n保险公司某一险种在四个不同地区一保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示年的索赔额情况记录如表所示.试判断试判断在四个不同地区索赔额有无显著的差异在四个不同地区索赔额有无显著的差异?第三十一页,本课件共有155
10、页32保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60第三十二页,本课件共有155页33n在在Excel工作表中输入上面的数据点击主菜单工作表中输入上面的数据点击主菜单中中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会出现一个就会出现一个“数据分析数据分析”的框的框.n 点击菜单中点击菜单中“方差分析方差分析:单因素方差分析单因素方差分析”点击点击“确定确定”,出现出现
11、“方差分析方差分析:单因素方差分单因素方差分析析”框框.第三十三页,本课件共有155页34n在在“输入区域输入区域”中标定你已经输入的数据的位中标定你已经输入的数据的位置根据你输入数据分组情况置根据你输入数据分组情况(是按行分或按列是按行分或按列分分)确定分组确定分组.n选定方差分析中选定方差分析中F检验的显著水平选定输出结检验的显著水平选定输出结果的位置点击果的位置点击“确定确定”.n 在你指定的区域中出现如下方差分析表在你指定的区域中出现如下方差分析表:第三十四页,本课件共有155页35方差来源平方和自由度均方F比P-valueF crit组间0.049230.01642.16590.12
12、08 3.0491 组内0.1666220.0076总计0.215825方差分析表方差分析表第三十五页,本课件共有155页36根据根据Excel给出的方差分析表给出的方差分析表,假设假设H0的判别有的判别有二种方法二种方法:第三十六页,本课件共有155页37第三十七页,本课件共有155页38第三十八页,本课件共有155页39方差分析的前提第三十九页,本课件共有155页40n方差分析和其它统计推断一样方差分析和其它统计推断一样,样本的独立性样本的独立性对方差分析是非常重要的对方差分析是非常重要的,在实际应用中会经在实际应用中会经常遇到非随机样本的情况常遇到非随机样本的情况,n这时使用方差分析得出
13、的结论不可靠这时使用方差分析得出的结论不可靠.因此因此,在安排试验或采集数据的过程中在安排试验或采集数据的过程中,一定要注意一定要注意样本的独立性问题样本的独立性问题.第四十页,本课件共有155页41n在实际中在实际中,没有一个总体真正服从正态分布的没有一个总体真正服从正态分布的,而方差分析却依赖于正态性的假设而方差分析却依赖于正态性的假设.不过由经验不过由经验可知可知,方差分析方差分析F检验对正态性的假设并不是非检验对正态性的假设并不是非常敏感常敏感,n即即,实际所得到的数据实际所得到的数据,若没有异常值和偏性若没有异常值和偏性,或或者说者说,数据显示的分布比较对称的话数据显示的分布比较对称
14、的话,即使样本即使样本容量比较小容量比较小(如每个水平下的样本容量仅为如每个水平下的样本容量仅为5左左右右),方差分析的结果仍是值得依赖的方差分析的结果仍是值得依赖的.第四十一页,本课件共有155页42n方差齐性对于方差分析是非常重要的方差齐性对于方差分析是非常重要的,因此在因此在方差分析之前往往要进行方差齐性的诊断方差分析之前往往要进行方差齐性的诊断,检验方差齐性假设通常采用检验方差齐性假设通常采用Barlett检验检验.n不过,也可采用如下的经验准则不过,也可采用如下的经验准则:当最大样当最大样本标准差不超过最小样本标准差的两倍时本标准差不超过最小样本标准差的两倍时,方差分析方差分析F检验
15、结果近似正确检验结果近似正确.第四十二页,本课件共有155页43例检验a,b两种药物的抗癌效果,要做动物试验。作法是:将患有某种癌的白鼠随机地分成三组。第一组:注射a物质,第二组:注射b物质,第三组:不做处理。经过一段时间观察后,得到寿命数据。在试验中,考虑白鼠的性别有可能对其寿命有显著的影响。将“性别”作为另一个因素“双因素试验双因素试验”。因素A:药物,三个水平;因素B:性别,二个水平;两个因素共有236种组合。2 双因素方差分析双因素方差分析第四十三页,本课件共有155页44(一)无交互作用的双因素方差分析 因素B因素A第四十四页,本课件共有155页45第四十五页,本课件共有155页46
16、分别检验假设第四十六页,本课件共有155页47第四十七页,本课件共有155页48第四十八页,本课件共有155页49第四十九页,本课件共有155页50第五十页,本课件共有155页51双因素无重复试验的方差分析表方差来源平方和自由度均方F比因素A因素B误差总和第五十一页,本课件共有155页52例 假定对3个小麦品种和3块试验地块进行区组设计试验,得到如下的数据:表小麦品种区组试验数据小麦品种(A)试验地块(B)总和B1B2B3A1258279242779A2302314336952A3321318327966总和8819119052697第五十二页,本课件共有155页53双因素无重复试验的方差分析
17、表方差来源平方和自由度均方F比F值=0.05因素A7232.666723616.333312.506.94因素B168.0000284.0000 0.296.94误差1157.33334289.3333总和8558.00008第五十三页,本课件共有155页54在这个问题中我们所关心的是因素A的效应,由方差分析表知,原假设不成立,即认为小麦品种的产量之间有显著差异。在这里,品种3的单产最高,而品种1的产量最低,因此可以断定品种3明显地优于品种1。第五十四页,本课件共有155页55(二)有交互作用的双因素方差分析 因素B因素A第五十五页,本课件共有155页56第五十六页,本课件共有155页57第五
18、十七页,本课件共有155页58分别检验假设:分别检验假设:第五十八页,本课件共有155页59第五十九页,本课件共有155页60第六十页,本课件共有155页61第六十一页,本课件共有155页62第六十二页,本课件共有155页63第六十三页,本课件共有155页64双因素试验的方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和第六十四页,本课件共有155页65例 为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到的数据列表如下。松树数据表松树种类地区1234123,15,26,13,2125,20,21,16,1821,17,
19、16,24,2714,17,19,20,24228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,19第六十五页,本课件共有155页66输出各单元总和及因素水平总和:松树数据的总和表单元总和B1B2B3B4水平总和A19810010594397A2120130116105471A3758410294355水平总和2933143232931223第六十六页,本课件共有155页67方差来源平方和自由度均方F比F值=0.05因素A3
20、44.93332172.46679.453.19因素B46.0500315.35000.842.80交互作用113.6000618.93331.042.30误差875.60004818.2417总和1380.183359双因素方差分析表第六十七页,本课件共有155页683 一元线性回归分析一元线性回归分析一、确定性关系一、确定性关系:当当自自变变量量给给定定一一个个值值时时,就就确确定定应应变变量量的的值值与与之之对对应应。如如:在在自自由由落落体体中中,物物体体下下落落的的高高度度h h与与下下落时间落时间t t之间有函数关系:之间有函数关系:变量与变量之间的关系变量与变量之间的关系第六十八
21、页,本课件共有155页69二、相关性关系:变变量量之之间间的的关关系系并并不不确确定定,而而是是表表现现为为具具有有随随机机性性的的一一种种“趋趋势势”。即即对对自自变变量量x的的同同一一值值,在在不不同同的的观观测测中中,因因变变量量Y可可以以取取不不同同的的值值,而而且且取取值值是是随随机机的的,但但对对应应x在在一一定定范范围围的的不不同同值值,对对Y进进行行观观测测时时,可可以以观观察察到到Y随随x的的变变化化而而呈呈现现有一定趋势的变化。有一定趋势的变化。第六十九页,本课件共有155页70n如:身高与体重,不存在这样的函数可以由身如:身高与体重,不存在这样的函数可以由身高计算出体重,
22、但从统计意义上来说,身高者,高计算出体重,但从统计意义上来说,身高者,体也重。体也重。n如:父亲的身高与儿子的身高之间也有一定如:父亲的身高与儿子的身高之间也有一定联系联系,通常父亲高,儿子也高。通常父亲高,儿子也高。第七十页,本课件共有155页71我们以一个例子来建立回归模型我们以一个例子来建立回归模型n某户人家打算安装太阳能热水器某户人家打算安装太阳能热水器.为了为了了解加热温度与燃气消耗的关系了解加热温度与燃气消耗的关系,记录了记录了16个月燃气的消耗量个月燃气的消耗量,数据见下表数据见下表.第七十一页,本课件共有155页72月份平均加热温度燃气用量月份平均加热温度燃气用量Nov.246
23、.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9第七十二页,本课件共有155页73n在回归分析时在回归分析时,我们称我们称“燃气消耗量燃气消耗量”为响应为响应变量记为变量记为Y,“加热温度加热温度”为解释变量记为为解释变量记为X,由由所得数据计算相关系数得所得数据计算相关系数得r=0.995,表明加热温表明加热温度与燃气消耗之间有非常好的线性相关性度与燃气消耗之间有非常好的线性相关性.
24、n如果以加热温度作为横轴如果以加热温度作为横轴,以消耗燃气量作以消耗燃气量作为纵轴为纵轴,得到散点图的形状大致呈线性得到散点图的形状大致呈线性.第七十三页,本课件共有155页74第七十四页,本课件共有155页75第七十五页,本课件共有155页76第七十六页,本课件共有155页77第七十七页,本课件共有155页78第七十八页,本课件共有155页79第七十九页,本课件共有155页80一元线性回归要解决的问题:第八十页,本课件共有155页81参数估计第八十一页,本课件共有155页82整理得正规方程系数行列式整理得正规方程系数行列式第八十二页,本课件共有155页83第八十三页,本课件共有155页84第
25、八十四页,本课件共有155页85 在在误误差差为为正正态态分分布布假假定定下下,的的最最小小二二乘估计等价于极大似然估计。乘估计等价于极大似然估计。第八十五页,本课件共有155页86n采用最大似然估计给出参数 的估计与最小二乘法给出的估计完全一致。n采用最大似然估计给出误差 的估计如下:此估计不是 的无偏估计。第八十六页,本课件共有155页87例例1 K.Pearson收集了大量父收集了大量父亲亲身高与儿子身高身高与儿子身高的的资资料。其中十料。其中十对对如下:如下:父亲身高x(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468
26、.370.170求求Y关于关于x的的线线性回性回归归方程。方程。第八十七页,本课件共有155页88第八十八页,本课件共有155页89参数性质第八十九页,本课件共有155页90即为正态随机变量的线性组合,所以服从正即为正态随机变量的线性组合,所以服从正态分布。态分布。证明(证明(1)第九十页,本课件共有155页91(2)类似可得。)类似可得。第九十一页,本课件共有155页92回归方程显著性检验采用最小二乘法估计参数,并不需要事先知道Y与x之间一定具有相关关系。因此(x)是否为x的线性函数:一要根据专业知识和实践来判断,二要根据实际观察得到的数据用假设检验方法来判断。第九十二页,本课件共有155页
27、93(1 1)影响)影响Y Y取值的,除了取值的,除了x x,还有其他不可忽略的因素;,还有其他不可忽略的因素;(2 2)E(Y)E(Y)与与x x的关系不是线性关系,而是其他关系;的关系不是线性关系,而是其他关系;(3 3)Y Y与与x x不存在关系。不存在关系。若原假设被拒绝,说明回归效果是显著的,否则,若接受若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明原假设,说明Y Y与与x x不是线性关系,回归方程无意义。回不是线性关系,回归方程无意义。回归效果不显著的原因可能有以下几种:归效果不显著的原因可能有以下几种:第九十三页,本课件共有155页94假设的检验统计量假设的检验统
28、计量与方差分析方法类似,仍采用平方和分解。与方差分析方法类似,仍采用平方和分解。一般地,用一般地,用来描述来描述 之间的总的差异大小,称之间的总的差异大小,称SST为总平方和。为总平方和。第九十四页,本课件共有155页95可以证明:第九十五页,本课件共有155页96可以证明,可以证明,由参数估计的性质可知,当由参数估计的性质可知,当 时,时,第九十六页,本课件共有155页97第九十七页,本课件共有155页98第九十八页,本课件共有155页99也可采用t检验第九十九页,本课件共有155页100例3检验例1中回归效果是否显著,取=0.05。第一百页,本课件共有155页101回归系数 的置信区间由第
29、一百零一页,本课件共有155页102第一百零二页,本课件共有155页103回归参数估计和显著性检验的Excel实现 例例 1(续(续)前面我们已经分析了加热温度与燃气消耗量前面我们已经分析了加热温度与燃气消耗量之间的关系之间的关系,认为两者具有较好的线性关系认为两者具有较好的线性关系,下面我们下面我们进一步建立燃气消耗量进一步建立燃气消耗量(响应变量响应变量)与加热温度与加热温度(解释变量解释变量)之间的回归方程之间的回归方程.采用采用Excel中的中的“数据分析数据分析”模块模块.n在在Excel工作表中输入上面的数据工作表中输入上面的数据 点击主菜单中点击主菜单中“工具工具”点击下拉式菜单
30、中点击下拉式菜单中“数据分析数据分析”就会出现一个就会出现一个“数数据分析据分析”的框,点击菜单中的框,点击菜单中“回归回归”,点击,点击“确定确定”,出现出现“回归回归”框框.第一百零三页,本课件共有155页104n在“Y值输入区域”中标定你已经输入的响应变量数据的位置,n在“X值输入区域”中标定你已经输入的解释变量数据的位置(注意:数据按“列”输入)“置信度”中输入你已经确定置信度的值选定输出结果的位置点击“确定”.n在指定位置输出相应的方差分析表和回归系数输出结果,例1的输出结果如下所示,第一百零四页,本课件共有155页105 自由度平方和均方F值P_值回归 1168.581168.58
31、11467.5511.415E-15误差 141.6080.115总的 15170.189方差分析表方差分析表第一百零五页,本课件共有155页106 Coef.标准误差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.387X0.1890.00538.3091.415E-150.1780.200n方差分析中方差分析中,给出了假设检验给出了假设检验 的的F检验检验.方方差分析表中各项也与前一节方差分析表中的意义类似差分析表中各项也与前一节方差分析表中的意义类似.值得注意的是值得注意的是,方差分析表中方差分析表中“
32、均方均方”列中列中,相应于相应于“误差误差”行的值即为模型误差方差的估计行的值即为模型误差方差的估计,即即n =0.115.第一百零六页,本课件共有155页107第一百零七页,本课件共有155页108第一百零八页,本课件共有155页109预测预测一般有两种意义.第一百零九页,本课件共有155页110第一百一十页,本课件共有155页111因此,根据观测结果,点预测为因此,根据观测结果,点预测为第一百一十一页,本课件共有155页112第一百一十二页,本课件共有155页113第一百一十三页,本课件共有155页114第一百一十四页,本课件共有155页115第一百一十五页,本课件共有155页116第一百
33、一十六页,本课件共有155页117第一百一十七页,本课件共有155页118例例 合合金金钢钢的的强强度度y与与钢钢材材中中碳碳的的含含量量x有有密密切切关关系系。为为了了冶冶炼炼出出符符合合要要求求强强度度的的钢钢常常常常通通过过控控制制钢钢水水中中的的碳碳含含量量来来达达到到目目的的,为为此此需需要要了了解解y与与x之之间间的的关关系系。其其中中x:碳碳含含量()量()y:钢的强度(:钢的强度(kg/mm2)数据见下:)数据见下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0
34、第一百一十八页,本课件共有155页119(1)画出散点图;)画出散点图;(2)设)设(x)=+x,(x)=+x,求求+的估计;的估计;(3 3)求误差方差的估计,画出残差图;)求误差方差的估计,画出残差图;(4 4)检验回归系数)检验回归系数是否为零(取是否为零(取=0.05)=0.05);(5 5)求回归系数)求回归系数的的9595置信区间;置信区间;(6 6)求在)求在x=0.06x=0.06点,回归函数的点估计和点,回归函数的点估计和9595置信置信区间;区间;(7 7)求在)求在x=0.06x=0.06点,点,Y Y的点预测和的点预测和9595区间预测。区间预测。第一百一十九页,本课件
35、共有155页120 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.1956 54 52 50 48 46 44 42 40 38 (1)合金钢的强度)合金钢的强度y与钢材中碳的含量与钢材中碳的含量x的散点图的散点图第一百二十页,本课件共有155页121第一百二十一页,本课件共有155页122第一百二十二页,本课件共有155页123第一百二十三页,本课件共有155页124 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19 x0e第一百二十四页,本课件共有155页125 0.03 0.05 0.07 0.09 0.11
36、0.13 0.15 0.17 0.1956 54 52 50 48 46 44 42 40 38 合金钢的强度y与钢材中碳的含量x的回归直线图第一百二十五页,本课件共有155页126显著水平为0.05第一百二十六页,本课件共有155页127第一百二十七页,本课件共有155页128第一百二十八页,本课件共有155页129n回归函数线性的诊断回归函数线性的诊断n误差方差齐性诊断误差方差齐性诊断n误差的独立性诊断误差的独立性诊断n误差的正态性诊断误差的正态性诊断4 回归诊断回归诊断第一百二十九页,本课件共有155页130一、回归函数线性的诊断一、回归函数线性的诊断第一百三十页,本课件共有155页13
37、1第一百三十一页,本课件共有155页132第一百三十二页,本课件共有155页133第一百三十三页,本课件共有155页134第一百三十四页,本课件共有155页135第一百三十五页,本课件共有155页136(2)模型修正 第一百三十六页,本课件共有155页137第一百三十七页,本课件共有155页138模型修改后的预测值及残差第一百三十八页,本课件共有155页139模型修改后的残差图第一百三十九页,本课件共有155页140二、误差方差齐性诊断二、误差方差齐性诊断第一百四十页,本课件共有155页141第一百四十一页,本课件共有155页142第一百四十二页,本课件共有155页143第一百四十三页,本课件
38、共有155页144(2)模型修正)模型修正n如果发现线性假设是不适合如果发现线性假设是不适合,那么就需那么就需要修改模型要修改模型.在目前的回归分析的知识水在目前的回归分析的知识水平下平下,不一定能很好地修改误差方差不相不一定能很好地修改误差方差不相等这类模型等这类模型,但可以尝试响应变量的数据但可以尝试响应变量的数据变换。变换。第一百四十四页,本课件共有155页145n用变换后的数据用变换后的数据,求出线性回归方求出线性回归方程程,求出残差求出残差,并画出以拟合值为横并画出以拟合值为横座标的残差图座标的残差图,如果这里残差图已经如果这里残差图已经没有任何规律没有任何规律,那么说明这种变换是那
39、么说明这种变换是适合的适合的.第一百四十五页,本课件共有155页146第一百四十六页,本课件共有155页147三、误差的独立性诊断三、误差的独立性诊断n在不少有关时间问题中,观测值往往呈相关的趋势。如河流的水位总有一个变化过程,当一场暴雨使河流水位上涨后往往需要几天才能使水位降低,因而当我们逐日测定河流最高水位时,相邻两天的观测间就不一定独立。第一百四十七页,本课件共有155页148(1)模型诊断 常用的残差图是以常用的残差图是以“时间时间”或或“序号序号”为横座标的残差图为横座标的残差图.相关相关性大约有二类性大约有二类.第一百四十八页,本课件共有155页149n一类是正相关一类是正相关,随
40、机误差之间具有正相关随机误差之间具有正相关的话的话,那么残差图中残差那么残差图中残差“符号符号”会出现会出现“集团性集团性”的趋势的趋势,即连续有一段时间内即连续有一段时间内残差均为残差均为“正号正号”,然后又一段时间内然后又一段时间内残差均为残差均为“负号负号”n 另一类是负相关另一类是负相关,此时此时,残差的符号改变残差的符号改变非常频繁非常频繁,大致有正负相间的趋势大致有正负相间的趋势.第一百四十九页,本课件共有155页150残差图第一百五十页,本课件共有155页151残差图第一百五十一页,本课件共有155页152(2)模型修改第一百五十二页,本课件共有155页153第一百五十三页,本课件共有155页154第一百五十四页,本课件共有155页01.03.2023感感谢谢大大家家观观看看第一百五十五页,本课件共有155页