《第13讲-方差分析-单因素模板优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第13讲-方差分析-单因素模板优秀PPT.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 方差分析方差分析-单因素方差分析单因素方差分析一、一、基本概念基本概念二、二、单因素方差分析的数学模型单因素方差分析的数学模型四、四、参数估计问题参数估计问题三、三、单因素方差分析的假设检验单因素方差分析的假设检验如:某种农作物的收获量如:某种农作物的收获量受作物品种、肥料种类及数量等的影响;受作物品种、肥料种类及数量等的影响;选择不同的品种、肥料种类及数量进行试选择不同的品种、肥料种类及数量进行试验,验,看哪一个影响大?并须要知道起显著作用看哪一个影响大?并须要知道起显著作用的因素在什么时候起最好的影响作用。的因素在什么时候起最好的影响作用。日常生活中常常发觉,影响一个事物的日常生活中常常
2、发觉,影响一个事物的因素很多,希望找到影响最显著的因素因素很多,希望找到影响最显著的因素方差分析就是解决这些问题的一种有效方法。方差分析就是解决这些问题的一种有效方法。ANOVA ANOVA 由英国统计由英国统计学家首创,为纪念学家首创,为纪念FisherFisher,以,以F F命名,故命名,故方差分析又称方差分析又称 F F 检验检验 (F F test test)。)。1.起源起源2.什么是方差分析什么是方差分析(ANOVA)(analysis of variance)1)、引例用上例)、引例用上例探讨问题:各肥料品种是否有差异。探讨问题:各肥料品种是否有差异。问题转化:各问题转化:各肥
3、料品种是否有差异体现为各肥料品种是否有差异体现为各肥料品种对小麦亩产量的影响否有显著差异。肥料品种对小麦亩产量的影响否有显著差异。记记 X1 1 为肥料为肥料A1 1下的小麦亩产量,下的小麦亩产量,m1为平均亩产为平均亩产量;量;X2 2 为肥料为肥料A2 2下的小麦亩产量,下的小麦亩产量,m2为平均亩为平均亩产量;产量;X3 3 为肥料为肥料A3 3下的小麦亩产量,下的小麦亩产量,m3为平均为平均亩产量;亩产量;X4 4 为肥料为肥料A4 4下的小麦亩产量,下的小麦亩产量,m4为平为平均亩产量;问题转化为均亩产量;问题转化为HH0 0:m m m m1 1=m m m m2 2=m m m
4、m3 3=m m m m4 4HH1 1:m m m m1 1 m m m m2 2 m m m m3 3 m m m m4 4不全等不全等检验多个母体平均数是否相等检验多个母体平均数是否相等2)、什么是方差分析)、什么是方差分析手段:分析数据的误差推断各母体均值是否相等手段:分析数据的误差推断各母体均值是否相等手段:分析数据的误差推断各母体均值是否相等手段:分析数据的误差推断各母体均值是否相等消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业1234567576649403453446839294556513
5、1492134404451657758【例】【例】为了对几个行业的服务质量进行评价,为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共业作为样本。最近一年中消费者对总共23家家企业投诉的次数如下表企业投诉的次数如下表3.方差分析的基本原理方差分析的基本原理 零售业零售业 旅游业旅游业 航空公司航空公司 家电制造家电制造(一)图形分析(一)图形分析子样平均值的折线子样平均值的折线1、从散点图上可以看出、从散点图上可以看出不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的即即使使是是在在
6、同同一一个个行行业业,不不同同企企业业被被投投诉诉的的次次数也明显不同数也明显不同家电制造被投诉的次数较高,航空公司被家电制造被投诉的次数较高,航空公司被投诉的次数较低投诉的次数较低2、行业与被投诉次数之间有确定的关系、行业与被投诉次数之间有确定的关系假如行业与被投诉次数之间没有关系,那么假如行业与被投诉次数之间没有关系,那么它们被投诉的次数应当差不多相同,在散点图它们被投诉的次数应当差不多相同,在散点图上所呈现的模式也就应当很接近上所呈现的模式也就应当很接近1、仅从散点图上视察还不能供应充分的证据证明不、仅从散点图上视察还不能供应充分的证据证明不同行业被投诉的次数之间有显著差异同行业被投诉的
7、次数之间有显著差异这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的随机性所造成的2、须要有更精确的方法来检验这种差异是否显著,、须要有更精确的方法来检验这种差异是否显著,也就是进行方差分析也就是进行方差分析所以叫方差分析,因为虽然我们感爱好的是均值,所以叫方差分析,因为虽然我们感爱好的是均值,但在推断均值之间是否有差异时则须要借助于方差但在推断均值之间是否有差异时则须要借助于方差这个名字也表示:它是通过对数据误差来源的分析这个名字也表示:它是通过对数据误差来源的分析推断不同母体的均值是否相等。因此,进行方差分析推断不同母体的均值是否相等。因此,进行方差分析时,须要考察数据误差
8、的来源。时,须要考察数据误差的来源。方差分析的思想方差分析的思想方差分析方差分析已探讨了两个方差相等的正态总体对均值比较已探讨了两个方差相等的正态总体对均值比较的假设检验问题的假设检验问题对有相同方差的多个正态总体均值进行比较的对有相同方差的多个正态总体均值进行比较的假设检验问题?假设检验问题?方差分析就是解决这类问题的有效方法方差分析就是解决这类问题的有效方法现在正是起先本节内容单因素单因素两因素两因素一、基本概念一、基本概念指标、因素、水平指标、因素、水平1、指标指标:试验结果值称为指标,一般表示为:试验结果值称为指标,一般表示为数值,用数值,用 X 表示。表示。2、因素(因子):试验中需
9、考察的可以限制、因素(因子):试验中需考察的可以限制的条件。用的条件。用 A,B,C 表示表示3、水平:因素所处的状态,一般用、水平:因素所处的状态,一般用A1、A2、A3、Ar。一般将因子限制在几个不同的状。一般将因子限制在几个不同的状态上,每一个状态称为因素的一个水平态上,每一个状态称为因素的一个水平.单因素方差分析单因素方差分析:众多因素中仅有一个因素的众多因素中仅有一个因素的的水平有多个,其余因素只有一个水平。的水平有多个,其余因素只有一个水平。多因素方差分析多因素方差分析:多个因素有多个水平多个因素有多个水平。四种肥料的亩产量四种肥料的亩产量肥料品种肥料品种亩产量(观察值)亩产量(观
10、察值)A1A2A3A4981964917669607693506358791642810705901703792883【例】为了比较四种肥料对小麦亩产量的影【例】为了比较四种肥料对小麦亩产量的影响,取一片土壤肥沃程度和水利浇灌条件差响,取一片土壤肥沃程度和水利浇灌条件差不多的土地分成不多的土地分成16块,肥料品种块,肥料品种A1、A2、A3、A4,每种肥料施在四块土地上,得亩产:,每种肥料施在四块土地上,得亩产:指标:亩产指标:亩产因素:肥料因素:肥料水平:水平:品种品种实例实例1.对某种型号的电池进行抽查,随机抽取了对某种型号的电池进行抽查,随机抽取了来自来自A,B,C三个工厂的产品,测得其
11、寿命(三个工厂的产品,测得其寿命(h)见见下表,设各工厂所生产的电池的寿命听从有相同下表,设各工厂所生产的电池的寿命听从有相同方差的正态分布,问这三个工厂所生产的电池的方差的正态分布,问这三个工厂所生产的电池的平均寿命有无显著差异?平均寿命有无显著差异?电池的寿命(电池的寿命(h)A1A2A33747406060 9586 98 67 92 6910098 试验的目的是为了考察不同厂家生产的电池平均试验的目的是为了考察不同厂家生产的电池平均寿命是否有显著差异。假如有显著差异,表明生产工寿命是否有显著差异。假如有显著差异,表明生产工厂这一因子对电池寿命的影响是显著的厂这一因子对电池寿命的影响是显
12、著的.在此实例中,在此实例中,指标:指标:电池的寿命;电池的寿命;因素:因素:生产电池的工厂;生产电池的工厂;水平:水平:工厂工厂A1、A2、A3 在此试验中,除生产电池的工厂这一因子外,其在此试验中,除生产电池的工厂这一因子外,其它因子不变,这是一个单因素试验。它因子不变,这是一个单因素试验。实例实例2.为了比较各个工作日进入某一商场的顾客人数,为了比较各个工作日进入某一商场的顾客人数,测得各工作日下午测得各工作日下午4时时5时进入商场的顾客人数如下表,时进入商场的顾客人数如下表,问各个工作日对顾客人数有无显著影响?问各个工作日对顾客人数有无显著影响?工作日工作日顾客人数顾客人数周一周一周二
13、周二周三周三周四周四周五周五 86 96 78 66 100 77 102 54 98 69 91 86 74 82 78 84 78 77 90 84 72 74 84 88 94 102 96 试验的目的是为了考察不同工作日顾客的人数是试验的目的是为了考察不同工作日顾客的人数是否有显著差异。假如有显著差异,表明工作日这一因否有显著差异。假如有显著差异,表明工作日这一因子对顾客人数的影响是显著的子对顾客人数的影响是显著的.在此实例中,在此实例中,指标:指标:顾客人数;顾客人数;因子:因子:工作日;工作日;水平:水平:周一、周二、周一、周四、周五周一、周二、周一、周四、周五 在此试验中,除工作
14、日这一因子外,其它因子不在此试验中,除工作日这一因子外,其它因子不变,这是一个单因素试验。变,这是一个单因素试验。二、单因素方差分析的数学模型二、单因素方差分析的数学模型 设在单因素试验中,设在单因素试验中,影响指标的因子影响指标的因子A 有有 s 个水平个水平A1,A2,As 将每个水平将每个水平Aj下要考察的指标作为一个总体称为部下要考察的指标作为一个总体称为部分总体,仍记为分总体,仍记为Aj,则共有,则共有s个部分总体个部分总体假设如下:假设如下:假设前提:假设前提:假设前提:假设前提:2)部分总体的方差都相等,即:)部分总体的方差都相等,即:其中其中和和 都是未知参数。都是未知参数。1
15、)每个部分总体都听从正态分布,即:)每个部分总体都听从正态分布,即:3)不同的部分总体下的样本是相互独立的。)不同的部分总体下的样本是相互独立的。在水平在水平Aj下进行下进行nj次独立试验,得样本次独立试验,得样本对每个水平对每个水平Aj下的样本下的样本 引进统计量:引进统计量:样本和:样本和:样本均值:样本均值:将单因素试验的数据列表如下:将单因素试验的数据列表如下:样本总均值:样本总均值:单因素试验数据表单因素试验数据表单因素试验数据表单因素试验数据表T.1 T.2 T.s样本和样本和T.j X11 X12 X1s X21 X22 X2s Xn11 Xn22 Xnss样样本本值值 A1 A
16、2 As部分总体部分总体样本均值样本均值总体均值.记记 称其为随机误差,则称其为随机误差,则由此得:由此得:单因素方差分析的数学模型单因素方差分析的数学模型单因素方差分析的数学模型单因素方差分析的数学模型:各个随机误差各个随机误差 相互独立,相互独立,和和 未知未知.由前面的假设我们知道由前面的假设我们知道(1)检验假设:)检验假设:不全相等不全相等.(2)求出未知参数)求出未知参数 和和 的估计量的估计量单因素方差分析的任务单因素方差分析的任务单因素方差分析的任务单因素方差分析的任务:依据样本供应的信息,依据样本供应的信息,统计量或枢轴量统计量或枢轴量三、单因素方差分析的假设检验三、单因素方
17、差分析的假设检验 单因素方差分析法是将样本总偏差的平单因素方差分析法是将样本总偏差的平方和分解成两个平方和,通过这两个平方和方和分解成两个平方和,通过这两个平方和之间的比较,导出假设检验的统计量和拒绝之间的比较,导出假设检验的统计量和拒绝域域.l偏差平方和及其分解偏差平方和及其分解偏差平方和及其分解偏差平方和及其分解总偏差平方和:总偏差平方和:效应(组间)平方和:效应(组间)平方和:说明:说明:说明:说明:SA反映了在每个水平下的样本均值与样本总均值反映了在每个水平下的样本均值与样本总均值的差异,它是由因子的差异,它是由因子A 取不同水平引起的,所以,称取不同水平引起的,所以,称SA是因子是因
18、子A的效应(组间)平方和的效应(组间)平方和.误差(组内)平方和:误差(组内)平方和:平方和分解公式:平方和分解公式:说明:说明:说明:说明:SE 表示在每个水平下的样本值与该水平下的样本表示在每个水平下的样本值与该水平下的样本均值的差异,它是由随机误差引起的,所以,称均值的差异,它是由随机误差引起的,所以,称SE是是误差(组内)平方和误差(组内)平方和.证明:证明:证明:证明:又又所以所以即:即:总平方和总平方和=效应(组间)平方和效应(组间)平方和+误差(组内)平方和误差(组内)平方和lSA和和 SE 的统计特征的统计特征在单因素方差分析的模型下,在单因素方差分析的模型下,(2)SA 和和
19、 SE 相互独立。相互独立。(3)为真时,为真时,定理:定理:(1)由定理(由定理(1),有),有即即结合定理结合定理(1)(2)(3),有,有(4)单因素方差分析的假设检验:单因素方差分析的假设检验:单因素方差分析的假设检验:单因素方差分析的假设检验:(1)提出统计假设)提出统计假设不全相等不全相等.(2)取假设统计量)取假设统计量(3)拒绝域:)拒绝域:说明:假如组间差异比组内差异大得多,则说明说明:假如组间差异比组内差异大得多,则说明说明:假如组间差异比组内差异大得多,则说明说明:假如组间差异比组内差异大得多,则说明各水平间有显著差异,各水平间有显著差异,各水平间有显著差异,各水平间有显
20、著差异,H0H0H0H0不真。不真。不真。不真。S ST T,S SA A,S SE E 的简便计算方法的简便计算方法的简便计算方法的简便计算方法记记化简得化简得单因素方差分析的假设检验的步骤:单因素方差分析的假设检验的步骤:单因素方差分析的假设检验的步骤:单因素方差分析的假设检验的步骤:(1)提出统计假设)提出统计假设不全相等不全相等.(2)编制单因素试验数据表)编制单因素试验数据表(3)依据数据表计算)依据数据表计算(4)填制单因素方差分析表)填制单因素方差分析表单因素方差分析表单因素方差分析表n-1ST总和总和SA/(s-1)SE/(n-s)s-1 n-sSASE组间组间组内组内临界值临
21、界值F值值均方均方自由度自由度平方和平方和方差来源方差来源(5)检验,若)检验,若否则接受否则接受H0,认为因子,认为因子A对指标没有显著影响对指标没有显著影响.则拒绝则拒绝H0,例例1.在显著性水平在显著性水平=0.01下,用单因素方差分析下,用单因素方差分析法推断实例法推断实例1中,三个工厂所生产的电池的平均中,三个工厂所生产的电池的平均寿命有无显著差异?寿命有无显著差异?解:解:提出统计假设提出统计假设不全相等不全相等.编制单因素试验数据表编制单因素试验数据表18446 37 60 69 47 86 100 40 67 98 60 92 95 98 样本样本和和样样本本值值 样本样本均值
22、均值 A1 A2 A3部分部分总体总体49826783 89单因素方差分析表单因素方差分析表总和总和组间组间组内组内临界值临界值F值值均方均方自由度自由度平方和平方和方差来源方差来源所以拒绝所以拒绝H0,因为因为认为三个工厂所生产的电池的平均寿命有显著差异认为三个工厂所生产的电池的平均寿命有显著差异.四、参数四、参数j 和方差和方差2的估计的估计前面已说明:前面已说明:又又所以所以(3)对均值差的区间估计问题)对均值差的区间估计问题若假设不成立,有时需要对 作区间估计.由区间估计又独立于于是于是的置信度为的置信度为的置信区间为的置信区间为故故注:单因子试验的统计分析可得如下三个结果注:单因子试
23、验的统计分析可得如下三个结果:(1)因子因子 A 是否显著是否显著.(2)试验的误差方差试验的误差方差2 的估计的估计.(3)各水平均值各水平均值i 的点估计与其差的区间估计的点估计与其差的区间估计.(此项在因子此项在因子A不显著时无需进行不显著时无需进行)例例2.试验试验4种不同的农药,视察它们的杀虫率有种不同的农药,视察它们的杀虫率有无明显的不同,试验结果如下表所示无明显的不同,试验结果如下表所示:部分总体部分总体A1A2A3A4样样本本值值87.485.080.290.588.587.394.756.262.455.048.21)在显著性水平)在显著性水平=0.01下,问下,问4种农药的
24、杀虫率的均种农药的杀虫率的均值是否有明显不同?值是否有明显不同?2)分别求)分别求4种不同农药的杀虫种不同农药的杀虫率的均值和方差的估计值。率的均值和方差的估计值。解:解:编制单因素试验数据表编制单因素试验数据表252.6 87.4 90.5 56.2 55.0 85.0 88.5 62.4 48.2 80.2 87.3 94.7 样本和样本和样样本本值值样本均值样本均值 A1 A2 A3 A4部分总体部分总体84.236190.2559.3118.6103.251.6(1)提出统计假设提出统计假设不全相等不全相等.单因素方差分析表单因素方差分析表所以拒绝所以拒绝H0,因为因为总和总和因子因子
25、A随机误差随机误差临界值临界值F值值均方均方自由度自由度平方和平方和方差来源方差来源认为认为4种农药的杀虫率的均值是有明显不同的种农药的杀虫率的均值是有明显不同的.(2)例例 某某公公司司想想对对新新销销售售人人员员进进行行不不同同的的销销售售培培训训,为为了了比比较较它它们们的的有有效效性性,随随机机选选择择了了三三组组销销售售人人员员,每每组组五五人人。一一组组接接受受A课课程程销销售售训训练练,一一组组接接受受销销售售B课课程程销销售售训训练练,另另一一组组C没没有有参参与与任任何何训训练练。当当前前两两组组的的训训练练课课程程结结束束时时,收收集集训训练练后后两两个个星星期期内内的的各
26、各组组销销售售人人员员的的销销售记录如下:售记录如下:Excel实例操作实例操作 A课程B课程C20582176344925179443339277730202437306722282578122720441681方差分析原始数据本例中取Excel第一中方法:自己编数据F的P值F-crit 其次种方法:干脆调用 方差分析结果表中各项目的含义方差分析结果表中各项目的含义SS 平方和df 自由度MS 均方F及F crit F值及F临界值,F crit=FINV(,df1,df2)P-value F分布的概率,P-value=FDIST(F,df1,df2)组间 处理组内 误差单因素方差分析单因素方
27、差分析 显著性推断显著性推断显著性推断显著性推断依据依据依据依据P-value P-value 推断:推断:推断:推断:P-value 0.01 P-value 0.01 极显著极显著极显著极显著 0.01P-value 0.05 0.010.05 P-value0.05 不显著不显著不显著不显著依据依据依据依据F critF crit推断:推断:推断:推断:F F crit F F crit 在在在在 水平上显著水平上显著水平上显著水平上显著 F F crit F F crit 在在在在 水平上不显著水平上不显著水平上不显著水平上不显著 单因素方差分析单因素方差分析单因素方差分析单因素方差分析小提示:P-value 供应的信息更具体例例1EXCEL