第六章多个多元均值向量的比较.ppt

上传人:石*** 文档编号:87194168 上传时间:2023-04-16 格式:PPT 页数:58 大小:4.91MB
返回 下载 相关 举报
第六章多个多元均值向量的比较.ppt_第1页
第1页 / 共58页
第六章多个多元均值向量的比较.ppt_第2页
第2页 / 共58页
点击查看更多>>
资源描述

《第六章多个多元均值向量的比较.ppt》由会员分享,可在线阅读,更多相关《第六章多个多元均值向量的比较.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六章多个多元均值向量的比较现在学习的是第1页,共58页6.2 单个总体均值的推断一、均值向量的检验二、置信区域三、联合置信区间现在学习的是第2页,共58页一、均值向量的检验设x1,x2,xn是取自总体xNp(,)的一个样本,这里0,np,欲检验H0:=0,H1:01.已知 检验统计量为 拒绝规则为:若 ,则拒绝H0现在学习的是第3页,共58页2.未知 检验统计量为 称之为霍特林(Hotelling)T2 统计量。当 H0 为真时 服从F(p,np),对给定的显著性水平,拒绝规则为:若 ,则拒绝H0 其中。现在学习的是第4页,共58页例62.1 对某地区农村的6名2周岁男婴的身高、胸围、上半臂

2、围进行测量,得样本数据如表4.2.1所示。根据以往资料,该地区城市2周岁男婴的这三个指标的均值0=(90,58,16),现欲在多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。这是假设检验问题:H0:=0,H1:0表4.2.1 某地区农村男婴的体格测量数据编 号身高(cm)胸围(cm)上半臂围(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0现在学习的是第5页,共58页查表得F0.01(3,3)=29.5,于是故在显著性水平=0.01下,拒绝原假设H0,即认为农村与城市的2周岁男婴上述三个指标

3、的均值有显著差异(p=0.002)。现在学习的是第6页,共58页二、置信区域现在学习的是第7页,共58页的置信度为1的置信区域为 当p=1时,它是一个区间;当p=2时,它是一个椭圆,这时可将其在坐标平面上画出;当p=3时,它是一个椭球;当p3时,它是一个超椭球;它们均以 为中心。同置信区间与假设检验的关系一样,置信区域与假设检验之间也有着同样的密切关系。一般来说,0包含在上述置信区域内,当且仅当原假设 H0:=0在显著性水平下被接受。因此,可以通过构造的置信区域的方法来进行假设检验。现在学习的是第8页,共58页三、联合置信区间即以1的概率对一切aRp成立,称它为一切线性组合a,aRp的置信度为

4、1的联合置信区间(simultaneous confidence intervals)。对k个线性组合ai,i=1,2,k,有现在学习的是第9页,共58页当k很小时,联合T2置信区间的置信度一般会明显地大于1,因而上述区间会显得过宽,即精确度明显偏低。这时,我们可以考虑采用邦弗伦尼 (Bonferroni)联合置信区间:它的置信度至少为1。若t/2k(n1)T,则邦弗伦尼区间比T2区间要窄,这时宜采用前者作为联合置信区间;反之,若t/2k(n1)T,则邦弗伦尼区间比T2 区间宽,宜采用后者作为联合置信区间。当k=p时,邦弗伦尼区间要比T2 区间窄。故在求的所有p个分量1,2,p的联合置信区间时

5、,应采用邦弗伦尼区间。现在学习的是第10页,共58页例6.2.2 为评估某职业培训中心的教学效果,随机抽取8名受训者,进行甲和乙两个项目的测试,其数据列于表4.2.2。假定x=(x1,x2)服从二元正态分布。n=8,p=2,取1=0.90,F0.10(2,6)=3.46,于是,T0.10=2.841。表4.2.2 两个项目的测试成绩编 号12345678甲项成绩x16280668475805479乙项成绩x27077758787916184现在学习的是第11页,共58页的0.90置信区域为即 0.0436(172.5)20.0812(172.5)(279)+0.0475(279)21.009这

6、是一个椭圆区域。1和2的0.90联合T2置信区间为即61.84183.16,68.80289.20这两个区间分别正是椭圆在1轴和2轴上的投影。现在学习的是第12页,共58页1和2的0.90邦弗伦尼联合置信区间为(t0.025(7)=2.3646)即63.63181.37,70.51287.49这个联合置信区间在精确度方面要好于T2联合置信区间。由该联合置信区间可得到置信度至少为0.90的矩形置信区域(见图4.2.1中的实线矩形),但其矩形面积要大于椭圆面积。现在学习的是第13页,共58页图4.2.1 置信椭圆和联合置信区间现在学习的是第14页,共58页利用置信区域进行假设检验在例4.2.2中,

7、如果在=0.10下对假设 H0:=0,H1:0 进行检验,其中=(1,2),0=(01,02),则我们容易利用图4.2.1中的椭圆得出检验的结果。若被检验值0位于图4.2.1中的椭圆外,则拒绝;反之,则接受。图4.2.1中的虚线矩形在1和2轴上的区间范围分别是1和2的0.90置信区间。当0位于椭圆外虚线矩形内的位置(如图中A点)时,检验结果虽拒绝H0,但如在=0.10下分别检验H01:1=01,H11:101 和 H02:2=02,H12:202则检验结果都将接受原假设;当0位于椭圆内虚线矩形外的位置(如图中B点)时,检验结果虽接受H0,但H01:1=01和H02:2=02都将会被拒绝。现在学

8、习的是第15页,共58页6.3 单个总体均值分量间结构关系的检验设x1,x2,xn是取自多元正态总体Np(,)的一个样本,0,np,欲检验H0:C=,H1:C其中C为一已知的kp矩阵,kp,rank(C)=k,为已知的k维向量。根据多元正态分布的性质知CxNk(C,CC)由于现在学习的是第16页,共58页故CC0。故我们可以用上一节检验假设H0:=0的方法来检验上述假设。检验统计量为当原假设H0:C=为真时,对于给定的显著性水平,拒绝规则为:若 ,则拒绝H0其中 。特别地,若欲检验H0:C=0,H1:C0则T2可简化为现在学习的是第17页,共58页例6.3.1 设xNp(,),=(1,2,p)

9、,0,x1,x2,xn是取自该总体的一个样本,欲检验H0:1=2=p,H1:ij,至少存在一对ij令则上面的假设可表达为H0:C=0,H1:C0检验统计量为现在学习的是第18页,共58页对于给定的显著性水平,拒绝规则为:若 ,则拒绝H0其中由于C是行满秩的,且每行均为对比向量(即有一个1和一个1,其余皆为0),故称C为对比矩阵。该例中对比矩阵C的选择不是惟一的,比如也可以选取对比矩阵为现在学习的是第19页,共58页例6.3.2 在例4.2.1中,假定人类有这样一个一般规律:身高、胸围和上半臂围的平均尺寸比例为6:4:1,我们希望检验表4.2.1中的数据是否符合这一规律,也就是欲检验H0:1/6

10、=2/4=3,H1:1/6,2/4,3至少有两个不等令则上面假设可表达为H0:C=0,H1:C0经计算从而现在学习的是第20页,共58页故又因所以拒绝原假设H0,即认为这组数据与人类的一般规律不一致(p=0.008)。上述的C也可以选择为检验的结果是不变的。现在学习的是第21页,共58页6.4 两个总体均值的比较推断一、两个独立样本的情形二、成对试验的T2统计量现在学习的是第22页,共58页一、两个独立样本的情形设从两个总体Np(1,)和Np(2,)中各自独立地抽取一个样本 和 ,0,欲检验H0:1=2,H1:121,2的无偏估计的联合无偏估计其中现在学习的是第23页,共58页为两个样本协方差

11、矩阵。霍特林T2检验统计量当原假设H0为真时,对给定的,拒绝规则为:若 ,则拒绝H0其中现在学习的是第24页,共58页在实际应用中,一旦H0:1=2被拒绝了,则可以考虑对所有的i(1ip),在相同的显著性水平下再进一步检验H0i:1i=2i,以判断是否有分量及(若有)具体是哪些分量对拒绝H0:1=2起了较大作用,这样做常常是有益的。a(12),aRp的1联合置信区间为当k很小时,可采用邦弗伦尼不等式给出ai(12),i=1,2,k的1联合置信区间现在学习的是第25页,共58页例6.4.1(例4.2.1续)表4.4.1给出了相应于表4.2.1的9名2周岁女婴的数据。我们欲在多元正态性假定下检验2

12、周岁的男婴与女婴的均值向量有无显著差异。表4.4.1 某地区农村女婴的体格测量数据编 号身高(cm)胸围(cm)上半臂围(cm)18058.414.027559.215.037860.315.047557.413.057959.514.067858.114.577558.012.586455.511.098059.212.5现在学习的是第26页,共58页从例4.2.1得从表4.4.1计算得现在学习的是第27页,共58页所以因,故不能拒绝原假设H0,即认为两个均值向量无显著差异(p=0.27)。现在学习的是第28页,共58页二、成对试验的T2统计量设(xi,yi),i=1,2,n(np)是成对试

13、验的数据,令di=xiyi,i=1,2,n又设d1,d2,dn独立同分布于Np(,),其中0,=12,1和2分别是总体x和总体y的均值向量。希望检验H0:1=2,H1:12等价于H0:=0,H1:0这样,两个总体的均值比较检验问题就可以化为一个总体的情形。检验统计量为现在学习的是第29页,共58页其中当原假设H0:=0为真时,统计量对给定的显著性水平,拒绝规则为:若 ,则拒绝H0其中现在学习的是第30页,共58页6.5 两个总体均值分量间结构关系的检验设两个独立的样本 和 分别取自总体Np(1,)和总体Np(2,),0,n1+n22p,我们希望检验H0:C(12)=,H1:C(12)其中C为一

14、已知的kp矩阵,kp,rank(C)=k,为一已知的k维向量。检验统计量为其中Sp是的联合无偏估计。当原假设H0为真时,现在学习的是第31页,共58页拒绝规则为:若 ,则拒绝H0其中例4.5.1 某种产品有甲、乙两种品牌,从甲产品批和乙产品批中分别随机地抽取5个样品,测量相同的5个指标,数据列于表4.5.1。在多元正态性假定下,试问甲、乙两种品牌产品的每个指标间的差异是否有显著的不同。该题就是要检验H0:C(乙甲)=0,H1:C(乙甲)0其中现在学习的是第32页,共58页表4.5.1 甲、乙两种品牌产品的指标值指标12345样品甲11118151815233273121173202827231

15、9418261818952223221610均 值20.824.422.619.214.0乙1181720181823124312620314161720174252431261853628242629均 值24.821.824.623.220.4现在学习的是第33页,共58页检验统计量为经计算现在学习的是第34页,共58页现在学习的是第35页,共58页所以 由于,所以在=0.05下拒绝原假设H0(p=0.044)。现在学习的是第36页,共58页6.6 多个总体均值的比较检验(多元方差分析)设有k个总体1,2,k,它们的分布分别是Np(1,),Np(2,),Np(k,),今从这k个总体中各自独

16、立地抽取一个样本,取自总体i的样本为 ,i=1,2,k。现欲检验H0:1=2=k,H1:ij,至少存在一对ij记现在学习的是第37页,共58页则SST=SSE+SSTR称SST、SSE和SSTR分别为总平方和及交叉乘积和、误差(或组内)平方和及交叉乘积和和处理(或组间)平方和及交叉乘积和,它们分别具有自由度(n1)、(nk)和(k1)。采用似然比方法可以得到威尔克斯(Wilks)统计量对给定的显著性水平,拒绝规则为:若p,k1,nkp,k1,nk,,则拒绝H0其中临界值p,k1,nk,满足:当原假设H0为真时,P(p,k1,nkp,k1,nk,)=p,m,r,常通过查F分布(或卡方分布)表得到

17、(或近似得到)。现在学习的是第38页,共58页例6.6.1 为了研究销售方式对商品销售额的影响,选择四种商品(甲、乙、丙和丁)按三种不同的销售方式(、和)进行销售。这四种商品的销售额分别为x1,x2,x3,x4,其数据见表4.6.1。表4.6.1 销售额数据编 号销售方式销售方式销售方式x1x2x3x4x1x2x3x4x1x2x3x4112560338210665445531065334802602119802333308245403210100344682953635126020365653122806563416265465514291504051477280117484682505130

18、6540320567544812931146339538066945350190385046821055305462357466058520042453511906451507320现在学习的是第39页,共58页81466627325011340390310110904422259875458524080555202006062440248101107750727076605071891106937726011107603642009433260280887829936012130613912006051429190736339032013804542927055403902951145549

19、42401460504421906548481177103544163101581542602806948442225100332733121613587507260125633122701406131234517574840028512056416280803628625018755252026070454683701355446834519766540325062664162241306932536020554241117069603772806057273260现在学习的是第40页,共58页该题中,我们需要检验H0:1=2=3,H1:1,2,3中至少有两个不相等其中1,2,3分别为销售方

20、式、和的总体均值向量。假定这三个总体均为多元正态总体,且它们的协差阵相同。p=4,k=3,n1=n2=n3=20,n=n1+n2+n3=60 现在学习的是第41页,共58页现在学习的是第42页,共58页于是由附录43中的(43.4)式可得查F分布表得,F0.01(8,108)=2.683.039,从而在=0.01的水平下拒绝原假设H0,因此可认为三种销售方式的销售额有十分显著的差异(p=0.004)。现在学习的是第43页,共58页为了解这三种销售方式的显著差异究竟是由哪些商品引起的,我们对这四种商品分别用一元方差分析方法进行检验分析。利用SSTR和SSE这两个矩阵对角线上的元素有 查表得,F0

21、.05(2,57)=3.16,F0.01(2,57)=5.01,故甲商品有显著差异(p=0.041),丁商品有十分显著的差异(p=0.001),而乙和丙商品无显著差异(p=0.208和p=0.848)。现在学习的是第44页,共58页如果剔除丁商品,然后再对其他三种商品用统计量进行检验,则有 F0.05(6,110)=2.181.328,不显著,因此说明对甲、乙、丙这三种商品,销售方式、和的总体均值向量之间无显著差异(p=0.251)。现在学习的是第45页,共58页 上面我们论述了多个遵从多元正态分布的总体的均值比较问题,在实际研究中,人们常常需要对来自两正态总体的样本做更细致的分析。比如,比较

22、两总体各个指标之间变动的幅度是否相等,进一步,如果两总体各指标之间的变量幅度相等,比较两总体的均值是否相等,更进一步,当通过了两总体均值相等的假设之后,检验两总体各个指标的取值是否相等。统计学家将对这类问题的解决方法归结为本节所讲的形象分析(Profile Analysis)。形象分析广泛地用于实验设计数据的检验,同时,也可应用于其他领域对多个指标的比较研究。本节主要讲述形象分析的基本思想,分析过程及用SPSS软件进行形象分析的方法。2023/4/746 目录 上页 下页 返回 结束6.6 形象分析现在学习的是第46页,共58页2023/4/747 目录 上页 下页 返回 结束2.3.1 形象

23、分析的基本思想 形象(profile)又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点,若总体有 个指标,则其形象即由坐标轴里 个点连接而成。注意这里的 个指标必须是同类可比指标,否则不能画到一个坐标里面。形象分析即是将两(多)总体的形象绘制到同一坐标下,根据形象(轮廓图)的形状对总体的均值进行比较分析。设我们要对 A、B 两个多元正态总体(方差相等)的 个同类指标作比较,分别从两总体随机抽取 、个样本,将样本均值作图得到如 图2-1所示的形象:现在学习的是第47页,共58页2023/4/748 目录 上页 下页 返回 结束2.3.1 形象分析的基

24、本思想 由上面的轮廓图可以清楚地看到,两总体的形象大体平行,也就是说,个指标的变动幅度大致相等,是否如此还须得到统计检验才能下结论。图2-1两总体的形象图现在学习的是第48页,共58页2023/4/749 目录 上页 下页 返回 结束2.3.1 形象分析的基本思想 进一步,若两总体形象平行的假设被接受,我们还想知道两总体的形象是否重合,即两总体均值是否相等。更进一步,若两总体均值相等,那么两总体的形象是否水平,即这 个指标之间是否有显著差异呢?形象分析就是针对这些问题,借助于方差分析的思想,依次提出两总体形象平行、重合、水平的假设,然后选择合适的统计量对这三个假设进行检验的分析。现在学习的是第

25、49页,共58页2023/4/750 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 设 均值向量 ,,均值向量 ,则针对上面的问题,相应的假设的形式与检验统计量如下所述:1.两总体形象平行的假设与检验统计量:(2.23)现在学习的是第50页,共58页2023/4/751 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论则上面的假设可写为:现在学习的是第51页,共58页2023/4/752 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论(2.25)则若:拒绝 ,否则没有足够理由拒绝,认为两总体的形象平行,若假设 被接受,则我们可以继续对下面两个假设给予检验.现

26、在学习的是第52页,共58页2023/4/753 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 2.两总体的形象重合的假设与检验统计量 (2.26)由前所述,反映了两总体之间的平均差异程度,因此可以求出 的置信区间,若所求置信区间显著不包括0,则说明两总体均值有明显差异,即拒绝两总体形象重合的假设,反之,没有足够理由拒绝 ,认为两总体形象是重合的。的极大似然估计为:(2.27)现在学习的是第53页,共58页2023/4/754 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 的置信区间:(2.28)其中:若0在上述置信区间内,则可以考虑接受,否则,拒绝。现在学习的是第

27、54页,共58页2023/4/755 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 实际上,在通过了两总体形象平行的前提下,对两总体形象重合的假设检验有更简单的形式。设假设 已经通过,则对于任意的(),与 必居其一,于是,两总体形象重合,当且仅当 =。因此,检验两总体形象重合,等价于检验如下假设:(2.29)于是,将从总体 中取得每一个样品各指标值相加,得到各指标和的 个数据 (),对从总体 中取得的 个样品作同样的加工,得到 个数据 ()。现在学习的是第55页,共58页2023/4/756 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 利用两个一元正态总体均值检验

28、中方差相等但未知的情况的检验方法,构造如下统计量:(2.30)式中,的定义如上,若 ,或者 则拒绝 ,否则没有足够理由拒绝,认为两总体形象重合。两总体形象重合的检验通过之后,可以进行如下两总体形象水平的检验。现在学习的是第56页,共58页2023/4/757 目录 上页 下页 返回 结束2.3.2 形象分析的基本理论 3.两总体形象水平的假设及检验统计量 在两总体形象重合的假设通过检验时,这两个正态总体实际上是来自同一总体。将所得到的 个数据合并,令 ,则 为所有观测的总平均向量,总体形象水平的假设如下:(2.31)若:(2.32)则拒绝 ;否则,可以考虑接受,认为总体的形象是水平的,即 个指标的取值是相等的。现在学习的是第57页,共58页2023/4/758 目录 上页 下页 返回 结束2.3.3 多个总体的形象分析 设有 个总体,从每个总体中取得 个样品,对每个样品观测 个指标,所得观测数据如下表示:其中,假定 令:则关于 这个总体形象平行、重合、水平的假设提法及检验统计量如下。现在学习的是第58页,共58页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁