方差分析与回归分析讲稿.ppt

上传人:石*** 文档编号:87108085 上传时间:2023-04-16 格式:PPT 页数:138 大小:2.18MB
返回 下载 相关 举报
方差分析与回归分析讲稿.ppt_第1页
第1页 / 共138页
方差分析与回归分析讲稿.ppt_第2页
第2页 / 共138页
点击查看更多>>
资源描述

《方差分析与回归分析讲稿.ppt》由会员分享,可在线阅读,更多相关《方差分析与回归分析讲稿.ppt(138页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于方差分析与回归分析第一页,讲稿共一百三十八页哦2n方差分析方差分析(Analysis of variance,简称简称:ANOVA),是由英国统计学家费歇尔是由英国统计学家费歇尔(Fisher)在在20世纪世纪20年代提出的年代提出的,可用于推可用于推断两个或两个以上总体均值是否有差异断两个或两个以上总体均值是否有差异的显著性检验的显著性检验.第二页,讲稿共一百三十八页哦39.1 单因素方差分析单因素方差分析例例1.1 为了比较三种不同类型日光灯管的寿命为了比较三种不同类型日光灯管的寿命(小时小时),现将从每种类型日光灯管中抽取现将从每种类型日光灯管中抽取 8个个,总总共共 24 个日光灯

2、管进行老化试验个日光灯管进行老化试验,根据下面经老根据下面经老化试验后测算得出的各个日光灯管的寿命化试验后测算得出的各个日光灯管的寿命(小小时时),试判断三种不同类型日光灯管的寿命是不是试判断三种不同类型日光灯管的寿命是不是有存在差异有存在差异.第三页,讲稿共一百三十八页哦4日光灯管的寿命日光灯管的寿命(小小时时)类型寿命(小时)类型I5290 6210 5740 5000 5930 6120 6080 5310类型II5840 5500 5980 6250 6470 5990 5470 5840类型.III7130 6660 6340 6470 7580 6560 7290 6730引起日光

3、灯管寿命不同的原因有二个方面引起日光灯管寿命不同的原因有二个方面:n其一其一,由于日光灯类型不同由于日光灯类型不同,而引起寿命不同而引起寿命不同.n其二其二,同一种类型日光灯管同一种类型日光灯管,由于其它随机因素由于其它随机因素的影响的影响,也使其寿命不同也使其寿命不同.第四页,讲稿共一百三十八页哦5n在方差分析中在方差分析中,通常把研究对象的特征值通常把研究对象的特征值,即所即所考察的试验结果考察的试验结果(例如日光灯管的寿命例如日光灯管的寿命)称为称为 试试验指标验指标.n对试验指标产生影响的原因称为对试验指标产生影响的原因称为 因素因素,“日光日光灯管类型灯管类型”即为即为因素因素.n因

4、素中各个不同状态称为因素中各个不同状态称为 水平水平,如日光灯管三个如日光灯管三个不同的类型不同的类型,即为三个即为三个水平水平.第五页,讲稿共一百三十八页哦6n单因素方差分析单因素方差分析 仅考虑有一个因素仅考虑有一个因素A对试验指对试验指标的影响标的影响.假如因素假如因素 A有有r 个水平个水平,分别在第分别在第 i 水平下进行了水平下进行了 多次独立观测多次独立观测,所得到的试验指标所得到的试验指标的数据的数据 第六页,讲稿共一百三十八页哦7 各个总体相互独立各个总体相互独立.因此因此,可写成如下的可写成如下的 数学模数学模型型:第七页,讲稿共一百三十八页哦8n 方差分析的目的就是要比较

5、因素方差分析的目的就是要比较因素A 的的r 个个水平下试验指标理论均值的差异水平下试验指标理论均值的差异,问题可问题可归结为比较这归结为比较这r个总体的均值差异个总体的均值差异.第八页,讲稿共一百三十八页哦9检验假设检验假设不全相等不全相等.第九页,讲稿共一百三十八页哦10假设等价于假设等价于不全为零不全为零.第十页,讲稿共一百三十八页哦11n为给出上面的检验,主要采用的方法是平方为给出上面的检验,主要采用的方法是平方和分解。即和分解。即n假设数据总的差异用总离差平方和假设数据总的差异用总离差平方和 分解为二个分解为二个部分部分:n 一部分是由于因素一部分是由于因素 A引起的差异引起的差异,即

6、效应平方即效应平方和和 ;n另一部分则由随机误差所引起的差异另一部分则由随机误差所引起的差异,即误差即误差平方和平方和 .第十一页,讲稿共一百三十八页哦12第十二页,讲稿共一百三十八页哦13证明:证明:第十三页,讲稿共一百三十八页哦14第十四页,讲稿共一百三十八页哦15第十五页,讲稿共一百三十八页哦16第十六页,讲稿共一百三十八页哦17第十七页,讲稿共一百三十八页哦18定理定理9.1.1第十八页,讲稿共一百三十八页哦19方差来源平方和自由度均方F因素Ar-1误差n-r总和n-1单因素试验方差分析表单因素试验方差分析表第十九页,讲稿共一百三十八页哦20第二十页,讲稿共一百三十八页哦21 例例1.

7、2 设设有有5种种治治疗疗荨荨麻麻疹疹的的药药,要要比比较较它它们们的的疗疗效效。假假设设将将30个个病病人人分分成成5组组,每每组组6人人,令令同同组组病病人人使使用用一一种种药药,并并记记录录病病人人从从使使用用药药物物开开始始到到痊痊愈愈所所需需时时间间,得得到到下下面面的的记录:记录:(=0.05)第二十一页,讲稿共一百三十八页哦22药物类型药物类型治愈所需天数治愈所需天数x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6第二十二页,讲稿共一百三十八页哦23这里药物是因子,共有这里药物是因子,共有5 5个水平,这

8、是个水平,这是一个单因素方差分析问题,要检验的假一个单因素方差分析问题,要检验的假设是设是“所有药物的效果都没有差别所有药物的效果都没有差别”。第二十三页,讲稿共一百三十八页哦24第二十四页,讲稿共一百三十八页哦25方差来源 平方和 自由度均方F因素A36.46749.117 3.90误差58.500252.334总和94.96729第二十五页,讲稿共一百三十八页哦26未知参数的估计未知参数的估计第二十六页,讲稿共一百三十八页哦27第二十七页,讲稿共一百三十八页哦28置信区间置信区间第二十八页,讲稿共一百三十八页哦29第二十九页,讲稿共一百三十八页哦30第三十页,讲稿共一百三十八页哦31假设检

9、验假设检验第三十一页,讲稿共一百三十八页哦32第三十二页,讲稿共一百三十八页哦33例例1.4(1.4(续续1.2)1.2)(1)(1)判断第一种、第二种药物的差异;判断第一种、第二种药物的差异;(2)(2)判断第一种、第三种药物的差异;判断第一种、第三种药物的差异;(3)(3)判断第三种、第五种药物的差异;判断第三种、第五种药物的差异;解:仅检验解:仅检验(1)(1),(2)(2)和和(3)(3)留作思考题留作思考题.第三十三页,讲稿共一百三十八页哦34第三十四页,讲稿共一百三十八页哦35在在Excel上实现方差分析上实现方差分析n先加载先加载数据分析数据分析 这个模块这个模块,方法如下方法如

10、下:n在在excel工作表中点击主菜单中工作表中点击主菜单中“工具工具”点击下拉式菜单点击下拉式菜单中中“加载宏加载宏”就会出现一个就会出现一个“加载宏加载宏”的框的框.n 在在“分析工具库分析工具库”前的框内打勾点击前的框内打勾点击“确定确定”.这时候这时候再点击下拉式菜单会新出现再点击下拉式菜单会新出现“数据分析数据分析”.然后就可以然后就可以进行统计分析了进行统计分析了.第三十五页,讲稿共一百三十八页哦36以下面的例子来说明用以下面的例子来说明用Excel进行方差分析进行方差分析的方法的方法:n保险公司某一险种在四个不同地区一年的保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示

11、索赔额情况记录如表所示.试判断在四个试判断在四个不同地区索赔额有无显著的差异不同地区索赔额有无显著的差异?第三十六页,讲稿共一百三十八页哦37保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60第三十七页,讲稿共一百三十八页哦38n在在Excel工作表中输入上面的数据点击主菜单中工作表中输入上面的数据点击主菜单中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会出就会出现一个现

12、一个“数据分析数据分析”的框的框.n 点击菜单中点击菜单中“方差分析方差分析:单因素方差分析单因素方差分析”点点击击“确定确定”,出现出现“方差分析方差分析:单因素方差分析单因素方差分析”框框.第三十八页,讲稿共一百三十八页哦39n在在“输入区域输入区域”中标定你已经输入的数据的位中标定你已经输入的数据的位置置(本例为本例为$B$3:$I$6),根据你输入数据分组情根据你输入数据分组情况况(是按行分或按列分是按行分或按列分,本例点击本例点击“行行”)确定分确定分组组.n选定方差分析中选定方差分析中F检验的显著水平选定输出结果检验的显著水平选定输出结果的位置点击的位置点击“确定确定”.n 在你指

13、定的区域中出现如下两张表在你指定的区域中出现如下两张表:第三十九页,讲稿共一百三十八页哦40组观测数求和平均方差行1行2行3行4758611.727.9913.199.371.6741.5981.6491.5620.00380.02100.00670.0026表一:摘要表一:摘要第四十页,讲稿共一百三十八页哦41方差来源平方和自由度均方FP-valueF crit组间0.049230.01642.16590.1208 3.0491 组内0.1666220.0076总计0.215825表二:方差分析表表二:方差分析表第四十一页,讲稿共一百三十八页哦42根据根据Excel给出的方差分析表给出的方差

14、分析表,假设假设H0的判别有二种的判别有二种方法方法:第四十二页,讲稿共一百三十八页哦43第四十三页,讲稿共一百三十八页哦44第四十四页,讲稿共一百三十八页哦45方差分析的前提方差分析的前提进行方差分析必须具备三个基本的条件:进行方差分析必须具备三个基本的条件:(1)独立性独立性.数据是来自数据是来自r个独立总体的简单个独立总体的简单随机样本;随机样本;(2)正态性正态性.r个独立总体均为正态总体;个独立总体均为正态总体;(3)方差齐性方差齐性.r个独立总体的方差相等个独立总体的方差相等.如何判断这些条件是否成立?这些条件如何判断这些条件是否成立?这些条件对于方差分析的结论影响又是如何?对于方

15、差分析的结论影响又是如何?第四十五页,讲稿共一百三十八页哦46n方差分析和其它统计推断一样方差分析和其它统计推断一样,样本的独立性对样本的独立性对方差分析是非常重要的方差分析是非常重要的,在实际应用中会经常在实际应用中会经常遇到非随机样本的情况遇到非随机样本的情况,n这时使用方差分析得出的结论不可靠这时使用方差分析得出的结论不可靠.因此因此,在在安排试验或采集数据的过程中安排试验或采集数据的过程中,一定要注意样本的一定要注意样本的独立性问题独立性问题.第四十六页,讲稿共一百三十八页哦47n在实际中在实际中,没有一个总体真正服从正态分布的没有一个总体真正服从正态分布的,而方差分析却依赖于正态性的

16、假设而方差分析却依赖于正态性的假设.不过由经验可知不过由经验可知,方差分析方差分析F检验对正态性的假设并不是非常敏感检验对正态性的假设并不是非常敏感,n即即,实际所得到的数据实际所得到的数据,若没有异常值和偏性若没有异常值和偏性,或或者说者说,数据显示的分布比较对称的话数据显示的分布比较对称的话,即使样本容即使样本容量比较小量比较小(如每个水平下的样本容量仅为如每个水平下的样本容量仅为5左右左右),方差分析的结果仍是值得信赖的方差分析的结果仍是值得信赖的.第四十七页,讲稿共一百三十八页哦48n方差齐性对于方差分析是非常重要的方差齐性对于方差分析是非常重要的,因此在方因此在方差分析之前往往要进行

17、方差齐性的诊断差分析之前往往要进行方差齐性的诊断,检验方检验方差齐性假设通常采用差齐性假设通常采用Barlett检验检验.n不过,也可采用如下的经验准则不过,也可采用如下的经验准则:当最大样本标当最大样本标准差不超过最小样本标准差的两倍时准差不超过最小样本标准差的两倍时,方差分方差分析析F检验结果近似正确检验结果近似正确.第四十八页,讲稿共一百三十八页哦499.4 一元线性回归一元线性回归一、确定性关系:一、确定性关系:当当自自变变量量给给定定一一个个值值时时,就就确确定定应应变变量量的的值值与与之之对对应应。如如:在在自自由由落落体体中中,物物体体下下落落的的高高度度h h与与下落时间下落时

18、间t t之间有函数关系:之间有函数关系:变量与变量之间的关系变量与变量之间的关系 第四十九页,讲稿共一百三十八页哦50二、相关性关系:二、相关性关系:变变量量之之间间的的关关系系并并不不确确定定,而而是是表表现现为为具具有有随随机机性性的的一一种种“趋趋势势”。即即对对自自变变量量x的的同同一一值值,在在不不同同的的观观测测中中,因因变变量量Y可可以以取取不不同同的的值值,而而且且取取值值是是随随机机的的,但但对对应应x在在一一定定范范围围的的不不同同值值,对对Y进进行行观观测测时时,可可以以观观察察到到Y随随x的的变变化化而而呈呈现现有有一定趋势的变化。一定趋势的变化。为统一记号,后面一律用

19、为统一记号,后面一律用y表示因变量表示因变量.第五十页,讲稿共一百三十八页哦51n如:身高与体重,不存在这样的函数可以由身如:身高与体重,不存在这样的函数可以由身高计算出体重,但从统计意义上来说,身高者,高计算出体重,但从统计意义上来说,身高者,体也重。体也重。n如:父亲的身高与儿子的身高之间也有一定如:父亲的身高与儿子的身高之间也有一定联系联系,通常父亲高,儿子也高。通常父亲高,儿子也高。第五十一页,讲稿共一百三十八页哦52我们以一个例子来建立回归模型我们以一个例子来建立回归模型n某户人家打算安装太阳能热水器某户人家打算安装太阳能热水器.为了了解为了了解加热温度与燃气消耗的关系加热温度与燃气

20、消耗的关系,记录了记录了16个个月燃气的消耗量月燃气的消耗量,数据见下表数据见下表.第五十二页,讲稿共一百三十八页哦53 月份平均加热温度燃气用量 月份平均加热温度燃气用量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9第五十三页,讲稿共一百三十八页哦54第五十四页,讲稿共一百三十八页哦55n如果以加热温度作为横轴如果以加热温度作为横轴,以消耗燃气量作以消耗燃气量作为纵轴

21、为纵轴,得到散点图的形状大致呈线性得到散点图的形状大致呈线性.n如果假设中间有一条直线,这些点均匀如果假设中间有一条直线,这些点均匀地散布在直线的两侧地散布在直线的两侧.表示除了温度外还表示除了温度外还有其它的因素影响燃气消耗量有其它的因素影响燃气消耗量.第五十五页,讲稿共一百三十八页哦56n在回归分析时在回归分析时,我们称我们称“燃气消耗量燃气消耗量”为为响应变量记为响应变量记为y,“加热温度加热温度”为解释变量为解释变量记为记为x,由所得数据计算相关系数得由所得数据计算相关系数得r=0.995,表明加热温度与燃气消耗之间有表明加热温度与燃气消耗之间有非常好的线性相关性非常好的线性相关性.第

22、五十六页,讲稿共一百三十八页哦57n加加热热温度温度x的的变变化是引起燃气消耗量化是引起燃气消耗量y 变变化的主化的主要因素要因素,还还有其他一些因素有其他一些因素对对燃气消耗量燃气消耗量y 也也起着影响起着影响,但但这这些因素是次要的些因素是次要的.n从数学形式来考从数学形式来考虑虑,由于加由于加热热温度温度x 的的变变化而化而引起燃气消耗量引起燃气消耗量y 变变化的主要部分化的主要部分记为记为 0+1x,其中,其中0,1是未知参数,是未知参数,n另一部分是由其他随机因素引起的另一部分是由其他随机因素引起的记为记为,即即y=0+1x+.第五十七页,讲稿共一百三十八页哦58对对从从总总体体(x

23、,y)中抽取的一个中抽取的一个样样本本(x1,y1),(x2,y2),(xn,yn)一元一元线线性回性回归归模型模型:第五十八页,讲稿共一百三十八页哦59在模型假定下在模型假定下yi(i=1,2,n)也是相互独立也是相互独立,服从正服从正态态分布分布N(0+1xi,2).由所得由所得样样本可本可给给出未知参数出未知参数0,1的点估的点估计计,分分别记为别记为称称为为y关于关于x的一元的一元线线性回性回归归方程方程.第五十九页,讲稿共一百三十八页哦60第六十页,讲稿共一百三十八页哦61一元线性回归要解决的问题:一元线性回归要解决的问题:第六十一页,讲稿共一百三十八页哦62参数估计参数估计第六十二

24、页,讲稿共一百三十八页哦63整理得正规方程系数行列式整理得正规方程系数行列式第六十三页,讲稿共一百三十八页哦64第六十四页,讲稿共一百三十八页哦65第六十五页,讲稿共一百三十八页哦66 在在误误差差为为正正态态分分布布假假定定下下,的的最最小小二二乘乘估估计等价于极大似然估计。计等价于极大似然估计。第六十六页,讲稿共一百三十八页哦67n采用最大似然估计给出参数 的估计与最小二乘法给出的估计完全一致。n采用最大似然估计给出误差 的估计如下:此估计不是 的无偏估计。第六十七页,讲稿共一百三十八页哦68例例3.1 K.Pearson收集了大量父收集了大量父亲亲身高与儿子身高身高与儿子身高的的资资料。

25、其中十料。其中十对对如下:如下:父亲身高x(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468.370.170求求y关于关于x的的线线性回性回归归方程。方程。第六十八页,讲稿共一百三十八页哦69第六十九页,讲稿共一百三十八页哦70参数性质参数性质第七十页,讲稿共一百三十八页哦71即为正态随机变量的线性组合,所以服从正态分布。即为正态随机变量的线性组合,所以服从正态分布。证明(证明(1)第七十一页,讲稿共一百三十八页哦72(2)类似可得。)类似可得。第七十二页,讲稿共一百三十八页哦73(3)回归方程显著性检验)回归方程显著性检验

26、采用最小二乘法估采用最小二乘法估计计参数参数 ,并不需要事,并不需要事先知道先知道y与与x之之间间一定具有相关关系。一定具有相关关系。因此因此(x)是否为是否为x的线性函数:的线性函数:一要根据专业知识和实践来判断,一要根据专业知识和实践来判断,二要根据实际观察得到的数据用假设检验方法二要根据实际观察得到的数据用假设检验方法来判断。来判断。第七十三页,讲稿共一百三十八页哦74(1 1)影响)影响y取值的,除了取值的,除了x,还有其他不可忽略的因素;,还有其他不可忽略的因素;(2 2)E(y)与与x的关系不是线性关系,而是其他关系;的关系不是线性关系,而是其他关系;(3 3)y与与x不存在关系。

27、不存在关系。若原假设被拒绝,说明回归效果是显著的,否则,若接受原若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明假设,说明y与与x不是线性关系,回归方程无意义。回归效不是线性关系,回归方程无意义。回归效果不显著的原因可能有以下几种:果不显著的原因可能有以下几种:第七十四页,讲稿共一百三十八页哦75第七十五页,讲稿共一百三十八页哦76第七十六页,讲稿共一百三十八页哦77回归方程的检验回归方程的检验采用方差分析方法采用方差分析方法:令令 描述描述 之间的总的差异大小,称之间的总的差异大小,称SST为总平方和。为总平方和。第七十七页,讲稿共一百三十八页哦78将总平方和分解为两部分:将总

28、平方和分解为两部分:可以证明:可以证明:SST=SSR+SSE称为回归平方和称为回归平方和称为残差平方和称为残差平方和第七十八页,讲稿共一百三十八页哦79第七十九页,讲稿共一百三十八页哦80第八十页,讲稿共一百三十八页哦81第八十一页,讲稿共一百三十八页哦82第八十二页,讲稿共一百三十八页哦83采用t检验回归系数的检验回归系数的检验第八十三页,讲稿共一百三十八页哦84例例3.2 检验检验例例3.1中回中回归归效果是否效果是否显显著,取著,取=0.05=0.05。第八十四页,讲稿共一百三十八页哦85(4)回归系数回归系数 的置信区间的置信区间由第八十五页,讲稿共一百三十八页哦86第八十六页,讲稿

29、共一百三十八页哦87回归参数估计和显著性检验的回归参数估计和显著性检验的Excel实现实现 例例 3.3(续(续)前面我们已经分析了加热温度与燃前面我们已经分析了加热温度与燃气消耗量之间的关系气消耗量之间的关系,认为两者具有较好的线认为两者具有较好的线性关系性关系,下面我们进一步建立燃气消耗量下面我们进一步建立燃气消耗量(响应响应变量变量)与加热温度与加热温度(解释变量解释变量)之间的回归方程之间的回归方程.采采用用Excel中的中的“数据分析数据分析”模块模块.第八十七页,讲稿共一百三十八页哦88平均加热温度燃气用量接前行 平均加热温度燃气用量1246.3901.225110.91011.2

30、3438.91162.14337.512123.15265.313306.4613414327.2741.7155211801.216306.9在在Excel的的A1:C17输输入下入下标标:第八十八页,讲稿共一百三十八页哦89n在在Excel工作表中输入上面的数据工作表中输入上面的数据 点击主菜单点击主菜单中中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会出现一个就会出现一个“数据分析数据分析”的框,点击菜单的框,点击菜单中中“回归回归”,点击,点击“确定确定”,出现出现“回归回归”框框.第八十九页,讲稿共一百三十八页哦90n在“Y值输入区域”中标定你已经输入的响应变量

31、数据的位置(本例为$C$2:$C$17),n在“X值输入区域”中标定你已经输入的解释变量数据的位置(注意:数据按“列”输入)(本例为$B$2:$B$17),“置信度”中输入你已经确定置信度的值选定输出结果的位置点击“确定”.n在指定位置输出相应的方差分析表和回归系数输出结果,例3.3的输出结果如下所示,第九十页,讲稿共一百三十八页哦91 自由度平方和均方F值P_值 回归 1168.581168.5811467.5511.415E-15显著!误差 14 1.608 0.115总的 15170.189方差分析表方差分析表第九十一页,讲稿共一百三十八页哦92 Coef.标准误差 t Stat P v

32、alue Lower 95%Upper 95%Intercept 1.089 0.139 7.841 1.729E-06 0.791 1.387X 0.189 0.005 38.309 1.415E-15 0.178 0.200与方差分析中与方差分析中P-值一致!值一致!第九十二页,讲稿共一百三十八页哦93预测预测一般有两种意义.第九十三页,讲稿共一百三十八页哦94(5)E(y0)的点估计及置信区间的点估计及置信区间故故 作作为为E(y0)的点估计,是无偏估计的点估计,是无偏估计.E(y0)的置信水平的置信水平为为1-的置信区间为的置信区间为第九十四页,讲稿共一百三十八页哦95因此,根据观测结

33、果,点预测为因此,根据观测结果,点预测为(6)y0的点预测及区间预测的点预测及区间预测第九十五页,讲稿共一百三十八页哦96第九十六页,讲稿共一百三十八页哦97第九十七页,讲稿共一百三十八页哦98第九十八页,讲稿共一百三十八页哦99第九十九页,讲稿共一百三十八页哦100Excel只能输出预测值,无法输出预测区间只能输出预测值,无法输出预测区间.预测区间计算如下:预测区间计算如下:上例中上例中x值置于值置于B2:B17,y值置于值置于C2:C17,在在Excel第第18行,行,B18,C18,D18,E18,F18,G18分别为分别为52.0342 22.313299.723 4719.438 2

34、.145第一百页,讲稿共一百三十八页哦10152.0342 22.313299.723 4719.438 2.145第一百零一页,讲稿共一百三十八页哦102例例3.5 合合金金钢钢的的强强度度y与与钢钢材材中中碳碳的的含含量量x有有密密切切关关系系。为为了了冶冶炼炼出出符符合合要要求求强强度度的的钢钢常常常常通通过过控控制制钢钢水水中中的的碳碳含含量量来来达达到到目目的的,为为此此需需要要了了解解y与与x之之间间的的关关系系。其其中中x:碳碳含含量量()y:钢钢的的强强度度(kg/mm2)数数据据见见右右表:表:yxx240.50.030.000939.50.040.0016410.050.0

35、02541.50.070.0049430.090.0081420.10.01450.120.014447.50.150.0225530.170.0289560.20.04第一百零二页,讲稿共一百三十八页哦103(1)画出散点图;)画出散点图;(2)设)设(x)=0+1x,求求0,1的估计;的估计;(3 3)求误差方差的估计,画出残差图;)求误差方差的估计,画出残差图;(4 4)检验回归系数)检验回归系数1是否为零(取是否为零(取=0.05)=0.05);(5 5)求回归系数)求回归系数1的的9595置信区间;置信区间;(6 6)求在)求在x=0.06=0.06点,回归函数的点估计和点,回归函数

36、的点估计和9595置信区间;置信区间;(7 7)求在)求在x=0.06=0.06点,点,y的点预测和的点预测和9595区间预测。区间预测。(8)(8)模型模型还还可以改可以改进吗进吗?第一百零三页,讲稿共一百三十八页哦104(1)合金钢的强度)合金钢的强度y与钢材中碳的含量与钢材中碳的含量x的散的散点图点图第一百零四页,讲稿共一百三十八页哦105方差分析dfSSMSFSignificance F回归1255.4116 255.4116 74.33289 2.54E-05残差827.488413.436051显著总计9282.9Coefficients标准误差t StatP-valueLower

37、 95%Upper 95%Intercept 35.4506 1.24292 28.52222.47E-09显著32.5844 38.3168X Var.192.6411 10.7452 8.621652.54E-05显著67.8627 117.420第一百零五页,讲稿共一百三十八页哦106第一百零六页,讲稿共一百三十八页哦107第一百零七页,讲稿共一百三十八页哦108显著水平为0.05第一百零八页,讲稿共一百三十八页哦109第一百零九页,讲稿共一百三十八页哦110方差分析dfSSMSFSignificance F回归分析2276.3151 138.1576 146.8669 1.92E-06

38、残差76.584894 0.940699显著总计9282.9Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept40.644 1.27932 31.7699 7.91E-09 37.6188 43.6691X Var.1-30.483 26.7175-1.14095 0.29142-93.66 32.6935X Var.2550.475 116.776 4.71394 0.00217 274.344 826.606不显著第一百一十页,讲稿共一百三十八页哦111方差分析dfSSMSFSignificance F回归分析1275.0905

39、 275.0905 281.8022 1.61E-07残差87.809465 0.976183总计9282.9Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept 39.2774 0.45804 85.7509 3.82E-13 38.2212 40.3337X Var.1420.223 25.0327 16.7870 1.61E-07 362.497 477.948第一百一十一页,讲稿共一百三十八页哦112n回归函数线性的诊断回归函数线性的诊断n误差方差齐性诊断误差方差齐性诊断n误差的独立性诊断误差的独立性诊断n误差的正态性诊断误差

40、的正态性诊断9.6 回归诊断回归诊断第一百一十二页,讲稿共一百三十八页哦113一、回归函数线性的诊断一、回归函数线性的诊断第一百一十三页,讲稿共一百三十八页哦114第一百一十四页,讲稿共一百三十八页哦115第一百一十五页,讲稿共一百三十八页哦116第一百一十六页,讲稿共一百三十八页哦117第一百一十七页,讲稿共一百三十八页哦118第一百一十八页,讲稿共一百三十八页哦119(2)模型修正)模型修正 第一百一十九页,讲稿共一百三十八页哦120第一百二十页,讲稿共一百三十八页哦121模型修改后的预测值及残差模型修改后的预测值及残差第一百二十一页,讲稿共一百三十八页哦122模型修改后的残差图模型修改后

41、的残差图第一百二十二页,讲稿共一百三十八页哦123二、误差方差齐性诊断二、误差方差齐性诊断第一百二十三页,讲稿共一百三十八页哦124第一百二十四页,讲稿共一百三十八页哦125第一百二十五页,讲稿共一百三十八页哦126第一百二十六页,讲稿共一百三十八页哦127(2)模型修正)模型修正n如果发现线性假设是不适合如果发现线性假设是不适合,那么就需要修那么就需要修改模型改模型.在目前的回归分析的知识水平下在目前的回归分析的知识水平下,不一定能很好地修改误差方差不相等这类不一定能很好地修改误差方差不相等这类模型模型,但可以尝试响应变量的数据变换。但可以尝试响应变量的数据变换。第一百二十七页,讲稿共一百三

42、十八页哦128n用变换后的数据用变换后的数据,求出线性回归方程求出线性回归方程,求出残差求出残差,并画出以拟合值为横座并画出以拟合值为横座标的残差图标的残差图,如果这里残差图已经没如果这里残差图已经没有任何规律有任何规律,那么说明这种变换是适那么说明这种变换是适合的合的.第一百二十八页,讲稿共一百三十八页哦129第一百二十九页,讲稿共一百三十八页哦130三、误差的独立性诊断三、误差的独立性诊断n在不少有关时间问题中,观测值往往呈相关的趋势。如河流的水位总有一个变化过程,当一场暴雨使河流水位上涨后往往需要几天才能使水位降低,因而当我们逐日测定河流最高水位时,相邻两天的观测间就不一定独立。第一百三

43、十页,讲稿共一百三十八页哦131(1)模型诊断模型诊断 常用的残差图是以常用的残差图是以“时间时间”或或“序号序号”为为横座标的残差图横座标的残差图.相关性大约有二类相关性大约有二类.第一百三十一页,讲稿共一百三十八页哦132n一类是正相关一类是正相关,随机误差之间具有正相关随机误差之间具有正相关的话的话,那么残差图中残差那么残差图中残差“符号符号”会出现会出现“集团性集团性”的趋势的趋势,即连续有一段时间内即连续有一段时间内残差均为残差均为“正号正号”,然后又一段时间内残然后又一段时间内残差均为差均为“负号负号”n 另一类是负相关另一类是负相关,此时此时,残差的符号改变残差的符号改变非常频繁非常频繁,大致有正负相间的趋势大致有正负相间的趋势.第一百三十二页,讲稿共一百三十八页哦133残差图残差图第一百三十三页,讲稿共一百三十八页哦134残差图残差图第一百三十四页,讲稿共一百三十八页哦135(2)模型修改)模型修改第一百三十五页,讲稿共一百三十八页哦136第一百三十六页,讲稿共一百三十八页哦137第一百三十七页,讲稿共一百三十八页哦感谢大家观看第一百三十八页,讲稿共一百三十八页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁