《概率论与数理统计第九章精选PPT.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第九章精选PPT.ppt(155页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于概率论与数理统计第九章1第1页,讲稿共155张,创作于星期二2n方差分析方差分析(Analysis of variance,简称简称:ANOVA),是由英国统计学家费歇尔是由英国统计学家费歇尔(Fisher)在在20世纪世纪20年代提出的年代提出的,可用于推断可用于推断两个或两个以上总体均值是否有差异的显两个或两个以上总体均值是否有差异的显著性检验著性检验.第2页,讲稿共155张,创作于星期二31单因素方差分析单因素方差分析例:为了比较三种不同类型日光灯管的寿命例:为了比较三种不同类型日光灯管的寿命(小时小时),现将从每种类型日光灯管中抽取现将从每种类型日光灯管中抽取 8个个,总共总共 2
2、4 个日光灯管进行老化试验个日光灯管进行老化试验,根据下面经老化试根据下面经老化试验后测算得出的各个日光灯管的寿命验后测算得出的各个日光灯管的寿命(小时小时),试判断三种不同类型日光灯管的寿命是不是有存在试判断三种不同类型日光灯管的寿命是不是有存在差异差异.第3页,讲稿共155张,创作于星期二4日光灯管的寿命日光灯管的寿命(小小时时)类型寿命(小时)类型I52906210574050005930612060805310类型II58405500598062506470599054705840类型.III71306660634064707580656072906730引起日光灯管寿命不同的原因有二
3、个方面引起日光灯管寿命不同的原因有二个方面:n其一其一,由于日光灯类型不同由于日光灯类型不同,而引起寿命不同而引起寿命不同.n其二其二,同一种类型日光灯管同一种类型日光灯管,由于其它随机因素的由于其它随机因素的影响影响,也使其寿命不同也使其寿命不同.第4页,讲稿共155张,创作于星期二5n在方差分析中在方差分析中,通常把研究对象的特征值通常把研究对象的特征值,即所即所考察的试验结果考察的试验结果(例如日光灯管的寿命例如日光灯管的寿命)称为称为 试验指标试验指标.n对试验指标产生影响的原因称为对试验指标产生影响的原因称为 因素因素,“日光日光灯管类型灯管类型”即为即为因素因素.n因素中各个不同状
4、态称为因素中各个不同状态称为 水平水平,如日光灯管三如日光灯管三个不同的类型个不同的类型,即为三个即为三个水平水平.第5页,讲稿共155张,创作于星期二6n单因素方差分析单因素方差分析 仅考虑有一个因素仅考虑有一个因素A对试验指对试验指标的影响标的影响.假如因素假如因素 A有有r 个水平个水平,分别在第分别在第 i 水平下进行了水平下进行了 多次独立观测多次独立观测,所得到的试验指所得到的试验指标的数据标的数据 第6页,讲稿共155张,创作于星期二7每个总体相互独立每个总体相互独立.因此因此,可写成如下的可写成如下的 数学模型数学模型:第7页,讲稿共155张,创作于星期二8n 方差分析的目的就
5、是要比较因素方差分析的目的就是要比较因素A 的的r 个水平下试验指标理论均值的差异个水平下试验指标理论均值的差异,问题可归结为比较这问题可归结为比较这r个总体的均值差个总体的均值差异异.第8页,讲稿共155张,创作于星期二9检验假设检验假设第9页,讲稿共155张,创作于星期二10假设等价于假设等价于第10页,讲稿共155张,创作于星期二11n为给出上面的检验,主要采用的方法是平方和为给出上面的检验,主要采用的方法是平方和分解。即分解。即n假设数据总的差异用总离差平方和假设数据总的差异用总离差平方和 分解为分解为二个部分二个部分:一部分是由于因素一部分是由于因素 A引起的差异引起的差异,即即效应
6、平方和效应平方和 ;另一部分则由随机误差所引另一部分则由随机误差所引起的差异,起的差异,即误差平方和即误差平方和 。第11页,讲稿共155张,创作于星期二12第12页,讲稿共155张,创作于星期二13证明:第13页,讲稿共155张,创作于星期二14第14页,讲稿共155张,创作于星期二15第15页,讲稿共155张,创作于星期二16第16页,讲稿共155张,创作于星期二17第17页,讲稿共155张,创作于星期二18定理9.1.1第18页,讲稿共155张,创作于星期二19方差来源平方和自由度均方F比因素Ar-1误差n-r总和n-1单因素试验方差分析表单因素试验方差分析表第19页,讲稿共155张,创
7、作于星期二20第20页,讲稿共155张,创作于星期二21例例1 设设有有5种种治治疗疗荨荨麻麻疹疹的的药药,要要比比较较它它们们的的疗疗效效。假假设设将将30个个病病人人分分成成5组组,每每组组6人人,令令同同组组病病人人使使用用一一种种药药,并并记记录录病病人人从从使使用用药药物物开开始始到到痊痊愈愈所所需需时时间间,得得到到下下面面的的记记录录:(=0.05)第21页,讲稿共155张,创作于星期二22药物类型治愈所需天数x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6第22页,讲稿共155张,创作于星期二23这里药
8、物是因子,共有这里药物是因子,共有5 5个水平,这是一个水平,这是一个单因素方差分析问题,要检验的假设是个单因素方差分析问题,要检验的假设是“所有药物的效果都没有差别所有药物的效果都没有差别”。第23页,讲稿共155张,创作于星期二24第24页,讲稿共155张,创作于星期二25方差来源平方和 自由度均方F比因素A36.46749.1173.90误差58.500252.334总和94.96729第25页,讲稿共155张,创作于星期二26未知参数的估计未知参数的估计第26页,讲稿共155张,创作于星期二27第27页,讲稿共155张,创作于星期二28第28页,讲稿共155张,创作于星期二29第29页
9、,讲稿共155张,创作于星期二30在在Excel上实现方差分析上实现方差分析n先加载先加载数据分析数据分析 这个模块这个模块,方法如下方法如下:n在在excel工作表中点击主菜单中工作表中点击主菜单中“工具工具”点击下拉式菜点击下拉式菜单中单中“加载宏加载宏”就会出现一个就会出现一个“加载宏加载宏”的框的框.n 在在“分析工具库分析工具库”前的框内打勾点击前的框内打勾点击“确定确定”.这这时候再点击下拉式菜单会新出现时候再点击下拉式菜单会新出现“数据分析数据分析”.然然后就可以进行统计分析了后就可以进行统计分析了.第30页,讲稿共155张,创作于星期二31以下面的例子来说明用以下面的例子来说明
10、用Excel进行方差分进行方差分析的方法析的方法:n保险公司某一险种在四个不同地区一年保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示的索赔额情况记录如表所示.试判断在试判断在四个不同地区索赔额有无显著的差异四个不同地区索赔额有无显著的差异?第31页,讲稿共155张,创作于星期二32保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60第32页,讲稿共155张,创作于星期二33n在在Ex
11、cel工作表中输入上面的数据点击主菜单工作表中输入上面的数据点击主菜单中中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会出现一个就会出现一个“数据分析数据分析”的框的框.n 点击菜单中点击菜单中“方差分析方差分析:单因素方差分析单因素方差分析”点击点击“确定确定”,出现出现“方差分析方差分析:单因素方差分析单因素方差分析”框框.第33页,讲稿共155张,创作于星期二34n在在“输入区域输入区域”中标定你已经输入的数据的位置中标定你已经输入的数据的位置根据你输入数据分组情况根据你输入数据分组情况(是按行分或按列分是按行分或按列分)确定分组确定分组.n选定方差分析中选定方差分
12、析中F检验的显著水平选定输出结果检验的显著水平选定输出结果的位置点击的位置点击“确定确定”.n 在你指定的区域中出现如下方差分析表在你指定的区域中出现如下方差分析表:第34页,讲稿共155张,创作于星期二35方差来源平方和自由度均方F比P-valueF crit组间0.049230.01642.16590.1208 3.0491 组内0.1666220.0076总计0.215825方差分析表方差分析表第35页,讲稿共155张,创作于星期二36根据根据Excel给出的方差分析表给出的方差分析表,假设假设H0的判别有二的判别有二种方法种方法:第36页,讲稿共155张,创作于星期二37第37页,讲稿
13、共155张,创作于星期二38第38页,讲稿共155张,创作于星期二39方差分析的前提第39页,讲稿共155张,创作于星期二40n方差分析和其它统计推断一样方差分析和其它统计推断一样,样本的独立性对样本的独立性对方差分析是非常重要的方差分析是非常重要的,在实际应用中会经常在实际应用中会经常遇到非随机样本的情况遇到非随机样本的情况,n这时使用方差分析得出的结论不可靠这时使用方差分析得出的结论不可靠.因此因此,在在安排试验或采集数据的过程中安排试验或采集数据的过程中,一定要注意样本一定要注意样本的独立性问题的独立性问题.第40页,讲稿共155张,创作于星期二41n在实际中在实际中,没有一个总体真正服
14、从正态分布的没有一个总体真正服从正态分布的,而方差分析却依赖于正态性的假设而方差分析却依赖于正态性的假设.不过由经验不过由经验可知可知,方差分析方差分析F检验对正态性的假设并不是非常敏检验对正态性的假设并不是非常敏感感,n即即,实际所得到的数据实际所得到的数据,若没有异常值和偏性若没有异常值和偏性,或或者说者说,数据显示的分布比较对称的话数据显示的分布比较对称的话,即使样本容即使样本容量比较小量比较小(如每个水平下的样本容量仅为如每个水平下的样本容量仅为5左右左右),方差分析的结果仍是值得依赖的方差分析的结果仍是值得依赖的.第41页,讲稿共155张,创作于星期二42n方差齐性对于方差分析是非常
15、重要的方差齐性对于方差分析是非常重要的,因此在方因此在方差分析之前往往要进行方差齐性的诊断差分析之前往往要进行方差齐性的诊断,检验检验方差齐性假设通常采用方差齐性假设通常采用Barlett检验检验.n不过,也可采用如下的经验准则不过,也可采用如下的经验准则:当最大样本标当最大样本标准差不超过最小样本标准差的两倍时准差不超过最小样本标准差的两倍时,方差分方差分析析F检验结果近似正确检验结果近似正确.第42页,讲稿共155张,创作于星期二43例检验a,b两种药物的抗癌效果,要做动物试验。作法是:将患有某种癌的白鼠随机地分成三组。第一组:注射a物质,第二组:注射b物质,第三组:不做处理。经过一段时间
16、观察后,得到寿命数据。在试验中,考虑白鼠的性别有可能对其寿命有显著的影响。将“性别”作为另一个因素“双因素试验双因素试验”。因素A:药物,三个水平;因素B:性别,二个水平;两个因素共有236种组合。2 双因素方差分析双因素方差分析第43页,讲稿共155张,创作于星期二44(一)无交互作用的双因素方差分析 因素B因素A第44页,讲稿共155张,创作于星期二45第45页,讲稿共155张,创作于星期二46分别检验假设第46页,讲稿共155张,创作于星期二47第47页,讲稿共155张,创作于星期二48第48页,讲稿共155张,创作于星期二49第49页,讲稿共155张,创作于星期二50第50页,讲稿共1
17、55张,创作于星期二51双因素无重复试验的方差分析表方差来源平方和自由度均方F比因素A因素B误差总和第51页,讲稿共155张,创作于星期二52例 假定对3个小麦品种和3块试验地块进行区组设计试验,得到如下的数据:表小麦品种区组试验数据小麦品种(A)试验地块(B)总和B1B2B3A1258279242779A2302314336952A3321318327966总和8819119052697第52页,讲稿共155张,创作于星期二53双因素无重复试验的方差分析表方差来源平方和自由度均方F比F值=0.05因素A7232.666723616.333312.506.94因素B168.0000284.00
18、00 0.296.94误差1157.33334289.3333总和8558.00008第53页,讲稿共155张,创作于星期二54在这个问题中我们所关心的是因素A的效应,由方差分析表知,原假设不成立,即认为小麦品种的产量之间有显著差异。在这里,品种3的单产最高,而品种1的产量最低,因此可以断定品种3明显地优于品种1。第54页,讲稿共155张,创作于星期二55(二)有交互作用的双因素方差分析 因素B因素A第55页,讲稿共155张,创作于星期二56第56页,讲稿共155张,创作于星期二57第57页,讲稿共155张,创作于星期二58分别检验假设:分别检验假设:第58页,讲稿共155张,创作于星期二59
19、第59页,讲稿共155张,创作于星期二60第60页,讲稿共155张,创作于星期二61第61页,讲稿共155张,创作于星期二62第62页,讲稿共155张,创作于星期二63第63页,讲稿共155张,创作于星期二64双因素试验的方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和第64页,讲稿共155张,创作于星期二65例 为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到的数据列表如下。松树数据表松树种类地区1234123,15,26,13,2125,20,21,16,1821,17,16,24,2714,17,19,20,2
20、4228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,19第65页,讲稿共155张,创作于星期二66输出各单元总和及因素水平总和:松树数据的总和表单元总和B1B2B3B4水平总和A19810010594397A2120130116105471A3758410294355水平总和2933143232931223第66页,讲稿共155张,创作于星期二67方差来源平方和自由度均方F比F值=0.05因素A344.93332172.4
21、6679.453.19因素B46.0500315.35000.842.80交互作用113.6000618.93331.042.30误差875.60004818.2417总和1380.183359双因素方差分析表第67页,讲稿共155张,创作于星期二683 一元线性回归分析一元线性回归分析一、确定性关系一、确定性关系:当当自自变变量量给给定定一一个个值值时时,就就确确定定应应变变量量的的值值与与之之对对应应。如如:在在自自由由落落体体中中,物物体体下下落落的的高高度度h h与下落时间与下落时间t t之间有函数关系:之间有函数关系:变量与变量之间的关系变量与变量之间的关系第68页,讲稿共155张,
22、创作于星期二69二、相关性关系:变变量量之之间间的的关关系系并并不不确确定定,而而是是表表现现为为具具有有随随机机性性的的一一种种“趋趋势势”。即即对对自自变变量量x的的同同一一值值,在在不不同同的的观观测测中中,因因变变量量Y可可以以取取不不同同的的值值,而而且且取取值值是是随随机机的的,但但对对应应x在在一一定定范范围围的的不不同同值值,对对Y进进行行观观测测时时,可可以以观观察察到到Y随随x的的变变化化而而呈呈现现有有一一定趋势的变化。定趋势的变化。第69页,讲稿共155张,创作于星期二70n如:身高与体重,不存在这样的函数可以由如:身高与体重,不存在这样的函数可以由身高计算出体重,但从
23、统计意义上来说,身身高计算出体重,但从统计意义上来说,身高者,体也重。高者,体也重。n如:父亲的身高与儿子的身高之间也有一定联如:父亲的身高与儿子的身高之间也有一定联系系,通常父亲高,儿子也高。通常父亲高,儿子也高。第70页,讲稿共155张,创作于星期二71我们以一个例子来建立回归模型我们以一个例子来建立回归模型n某户人家打算安装太阳能热水器某户人家打算安装太阳能热水器.为了为了了解加热温度与燃气消耗的关系了解加热温度与燃气消耗的关系,记录了记录了16个月燃气的消耗量个月燃气的消耗量,数据见下表数据见下表.第71页,讲稿共155张,创作于星期二72月份平均加热温度燃气用量月份平均加热温度燃气用
24、量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9第72页,讲稿共155张,创作于星期二73n在回归分析时在回归分析时,我们称我们称“燃气消耗量燃气消耗量”为响应变为响应变量记为量记为Y,“加热温度加热温度”为解释变量记为为解释变量记为X,由所由所得数据计算相关系数得得数据计算相关系数得r=0.995,表明加热温度表明加热温度与燃气消耗之间有非常好的线性相关性与燃气消耗之
25、间有非常好的线性相关性.n如果以加热温度作为横轴如果以加热温度作为横轴,以消耗燃气量作为纵以消耗燃气量作为纵轴轴,得到散点图的形状大致呈线性得到散点图的形状大致呈线性.第73页,讲稿共155张,创作于星期二74第74页,讲稿共155张,创作于星期二75第75页,讲稿共155张,创作于星期二76第76页,讲稿共155张,创作于星期二77第77页,讲稿共155张,创作于星期二78第78页,讲稿共155张,创作于星期二79第79页,讲稿共155张,创作于星期二80一元线性回归要解决的问题:第80页,讲稿共155张,创作于星期二81参数估计第81页,讲稿共155张,创作于星期二82整理得正规方程系数行
26、列式整理得正规方程系数行列式第82页,讲稿共155张,创作于星期二83第83页,讲稿共155张,创作于星期二84第84页,讲稿共155张,创作于星期二85 在在误误差差为为正正态态分分布布假假定定下下,的的最最小小二二乘乘估计等价于极大似然估计。估计等价于极大似然估计。第85页,讲稿共155张,创作于星期二86n采用最大似然估计给出参数 的估计与最小二乘法给出的估计完全一致。n采用最大似然估计给出误差 的估计如下:此估计不是 的无偏估计。第86页,讲稿共155张,创作于星期二87例例1 K.Pearson收集了大量父收集了大量父亲亲身高与儿子身高身高与儿子身高的的资资料。其中十料。其中十对对如
27、下:如下:父亲身高x(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468.370.170求求Y关于关于x的的线线性回性回归归方程。方程。第87页,讲稿共155张,创作于星期二88第88页,讲稿共155张,创作于星期二89参数性质第89页,讲稿共155张,创作于星期二90即为正态随机变量的线性组合,所以服从即为正态随机变量的线性组合,所以服从正态分布。正态分布。证明(证明(1)第90页,讲稿共155张,创作于星期二91(2)类似可得。)类似可得。第91页,讲稿共155张,创作于星期二92回归方程显著性检验采用最小二乘法估计参数,并
28、不需要事先知道Y与x之间一定具有相关关系。因此(x)是否为x的线性函数:一要根据专业知识和实践来判断,二要根据实际观察得到的数据用假设检验方法来判断。第92页,讲稿共155张,创作于星期二93(1 1)影响)影响Y Y取值的,除了取值的,除了x x,还有其他不可忽略的因素;,还有其他不可忽略的因素;(2 2)E(Y)E(Y)与与x x的关系不是线性关系,而是其他关系;的关系不是线性关系,而是其他关系;(3 3)Y Y与与x x不存在关系。不存在关系。若原假设被拒绝,说明回归效果是显著的,否则,若若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明接受原假设,说明Y Y与与x x不是线
29、性关系,回归方程无意不是线性关系,回归方程无意义。回归效果不显著的原因可能有以下几种:义。回归效果不显著的原因可能有以下几种:第93页,讲稿共155张,创作于星期二94假设的检验统计量假设的检验统计量与方差分析方法类似,仍采用平方和分解。与方差分析方法类似,仍采用平方和分解。一般地,用一般地,用来描述来描述 之间的总的差异大小,称之间的总的差异大小,称SST为总平方和。为总平方和。第94页,讲稿共155张,创作于星期二95可以证明:第95页,讲稿共155张,创作于星期二96可以证明,可以证明,由参数估计的性质可知,当由参数估计的性质可知,当 时,时,第96页,讲稿共155张,创作于星期二97第
30、97页,讲稿共155张,创作于星期二98第98页,讲稿共155张,创作于星期二99也可采用t检验第99页,讲稿共155张,创作于星期二100例3检验例1中回归效果是否显著,取=0.05。第100页,讲稿共155张,创作于星期二101回归系数 的置信区间由第101页,讲稿共155张,创作于星期二102第102页,讲稿共155张,创作于星期二103回归参数估计和显著性检验的Excel实现 例例 1(续(续)前面我们已经分析了加热温度与燃气消耗量之间前面我们已经分析了加热温度与燃气消耗量之间的关系的关系,认为两者具有较好的线性关系认为两者具有较好的线性关系,下面我们进一步建下面我们进一步建立燃气消耗
31、量立燃气消耗量(响应变量响应变量)与加热温度与加热温度(解释变量解释变量)之间的回归方之间的回归方程程.采用采用Excel中的中的“数据分析数据分析”模块模块.n在在Excel工作表中输入上面的数据工作表中输入上面的数据 点击主菜单中点击主菜单中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会出现一个就会出现一个“数据数据分析分析”的框,点击菜单中的框,点击菜单中“回归回归”,点击,点击“确定确定”,出出现现“回归回归”框框.第103页,讲稿共155张,创作于星期二104n在“Y值输入区域”中标定你已经输入的响应变量数据的位置,n在“X值输入区域”中标定你已经输入的解释变量
32、数据的位置(注意:数据按“列”输入)“置信度”中输入你已经确定置信度的值选定输出结果的位置点击“确定”.n在指定位置输出相应的方差分析表和回归系数输出结果,例1的输出结果如下所示,第104页,讲稿共155张,创作于星期二105 自由度平方和均方F值P_值回归 1168.581168.5811467.5511.415E-15误差 141.6080.115总的 15170.189方差分析表方差分析表第105页,讲稿共155张,创作于星期二106 Coef.标准误差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.3
33、87X0.1890.00538.3091.415E-150.1780.200n方差分析中方差分析中,给出了假设检验给出了假设检验 的的F检验检验.方方差分析表中各项也与前一节方差分析表中的意义类差分析表中各项也与前一节方差分析表中的意义类似似.值得注意的是值得注意的是,方差分析表中方差分析表中“均方均方”列中列中,相应相应于于“误差误差”行的值即为模型误差方差的估计行的值即为模型误差方差的估计,即即n =0.115.第106页,讲稿共155张,创作于星期二107第107页,讲稿共155张,创作于星期二108第108页,讲稿共155张,创作于星期二109预测预测一般有两种意义.第109页,讲稿共
34、155张,创作于星期二110第110页,讲稿共155张,创作于星期二111因此,根据观测结果,点预测为因此,根据观测结果,点预测为第111页,讲稿共155张,创作于星期二112第112页,讲稿共155张,创作于星期二113第113页,讲稿共155张,创作于星期二114第114页,讲稿共155张,创作于星期二115第115页,讲稿共155张,创作于星期二116第116页,讲稿共155张,创作于星期二117第117页,讲稿共155张,创作于星期二118例例 合合金金钢钢的的强强度度y与与钢钢材材中中碳碳的的含含量量x有有密密切切关关系系。为为了了冶冶炼炼出出符符合合要要求求强强度度的的钢钢常常常常
35、通通过过控控制制钢钢水水中中的的碳碳含含量量来来达达到到目目的的,为为此此需需要要了了解解y与与x之之间间的的关关系系。其其中中x:碳碳含含量()量()y:钢的强度(:钢的强度(kg/mm2)数据见下:)数据见下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0第118页,讲稿共155张,创作于星期二119(1)画出散点图;)画出散点图;(2)设)设(x)=+x,(x)=+x,求求+的估计;的估计;(3 3)求误差方差的估计,画出残差图;)求误差方差的估计,画出残差图;(4 4)
36、检验回归系数)检验回归系数是否为零(取是否为零(取=0.05)=0.05);(5 5)求回归系数)求回归系数的的9595置信区间;置信区间;(6 6)求在)求在x=0.06x=0.06点,回归函数的点估计和点,回归函数的点估计和9595置信区置信区间;间;(7 7)求在)求在x=0.06x=0.06点,点,Y Y的点预测和的点预测和9595区间预测。区间预测。第119页,讲稿共155张,创作于星期二120 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.1956 54 52 50 48 46 44 42 40 38 (1)合金钢的强度)合金钢的强度y与钢材中
37、碳的含量与钢材中碳的含量x的的散点图散点图第120页,讲稿共155张,创作于星期二121第121页,讲稿共155张,创作于星期二122第122页,讲稿共155张,创作于星期二123第123页,讲稿共155张,创作于星期二124 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19 x0e第124页,讲稿共155张,创作于星期二125 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.1956 54 52 50 48 46 44 42 40 38 合金钢的强度y与钢材中碳的含量x的回归直线图第125页,讲稿共155张,创作于星
38、期二126显著水平为0.05第126页,讲稿共155张,创作于星期二127第127页,讲稿共155张,创作于星期二128第128页,讲稿共155张,创作于星期二129n回归函数线性的诊断回归函数线性的诊断n误差方差齐性诊断误差方差齐性诊断n误差的独立性诊断误差的独立性诊断n误差的正态性诊断误差的正态性诊断4 回归诊断回归诊断第129页,讲稿共155张,创作于星期二130一、回归函数线性的诊断一、回归函数线性的诊断第130页,讲稿共155张,创作于星期二131第131页,讲稿共155张,创作于星期二132第132页,讲稿共155张,创作于星期二133第133页,讲稿共155张,创作于星期二134
39、第134页,讲稿共155张,创作于星期二135第135页,讲稿共155张,创作于星期二136(2)模型修正 第136页,讲稿共155张,创作于星期二137第137页,讲稿共155张,创作于星期二138模型修改后的预测值及残差第138页,讲稿共155张,创作于星期二139模型修改后的残差图第139页,讲稿共155张,创作于星期二140二、误差方差齐性诊断二、误差方差齐性诊断第140页,讲稿共155张,创作于星期二141第141页,讲稿共155张,创作于星期二142第142页,讲稿共155张,创作于星期二143第143页,讲稿共155张,创作于星期二144(2)模型修正)模型修正n如果发现线性假设
40、是不适合如果发现线性假设是不适合,那么就需要修那么就需要修改模型改模型.在目前的回归分析的知识水平下在目前的回归分析的知识水平下,不一定能很好地修改误差方差不相等这类不一定能很好地修改误差方差不相等这类模型模型,但可以尝试响应变量的数据变换。但可以尝试响应变量的数据变换。第144页,讲稿共155张,创作于星期二145n用变换后的数据用变换后的数据,求出线性回归方程求出线性回归方程,求出残差求出残差,并画出以拟合值为横座标的并画出以拟合值为横座标的残差图残差图,如果这里残差图已经没有任如果这里残差图已经没有任何规律何规律,那么说明这种变换是适合的那么说明这种变换是适合的.第145页,讲稿共155
41、张,创作于星期二146第146页,讲稿共155张,创作于星期二147三、误差的独立性诊断三、误差的独立性诊断n在不少有关时间问题中,观测值往往呈相关的趋势。如河流的水位总有一个变化过程,当一场暴雨使河流水位上涨后往往需要几天才能使水位降低,因而当我们逐日测定河流最高水位时,相邻两天的观测间就不一定独立。第147页,讲稿共155张,创作于星期二148(1)模型诊断 常用的残差图是以常用的残差图是以“时间时间”或或“序号序号”为横座标的残差图为横座标的残差图.相相关性大约有二类关性大约有二类.第148页,讲稿共155张,创作于星期二149n一类是正相关一类是正相关,随机误差之间具有正相随机误差之间
42、具有正相关的话关的话,那么残差图中残差那么残差图中残差“符号符号”会出会出现现“集团性集团性”的趋势的趋势,即连续有一段时间即连续有一段时间内残差均为内残差均为“正号正号”,然后又一段时间内然后又一段时间内残差均为残差均为“负号负号”n 另一类是负相关另一类是负相关,此时此时,残差的符号改变残差的符号改变非常频繁非常频繁,大致有正负相间的趋势大致有正负相间的趋势.第149页,讲稿共155张,创作于星期二150残差图第150页,讲稿共155张,创作于星期二151残差图第151页,讲稿共155张,创作于星期二152(2)模型修改第152页,讲稿共155张,创作于星期二153第153页,讲稿共155张,创作于星期二154第154页,讲稿共155张,创作于星期二02.10.2022感感谢谢大大家家观观看看第155页,讲稿共155张,创作于星期二