《(精品)第四章 多元正态总体均值向量和协差阵的假设检验.ppt》由会员分享,可在线阅读,更多相关《(精品)第四章 多元正态总体均值向量和协差阵的假设检验.ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 多元正态总体均值向量和协差阵的假设检验多元正态总体均值向量和协差阵的假设检验在常用的多元统计分析方法中在常用的多元统计分析方法中在常用的多元统计分析方法中在常用的多元统计分析方法中,常常需要对总体的均值向量和协差阵常常需要对总体的均值向量和协差阵常常需要对总体的均值向量和协差阵常常需要对总体的均值向量和协差阵进行检验进行检验进行检验进行检验,比如比如比如比如,对两个总体做判别分析时对两个总体做判别分析时对两个总体做判别分析时对两个总体做判别分析时,事先需要对两个总体的均事先需要对两个总体的均事先需要对两个总体的均事先需要对两个总体的均值作假设检验值作假设检验值作假设检验值作假设检
2、验,看是否在统计上两个总体的均值有显著性的差异看是否在统计上两个总体的均值有显著性的差异看是否在统计上两个总体的均值有显著性的差异看是否在统计上两个总体的均值有显著性的差异,否者否者否者否者作判别分析就无意义作判别分析就无意义作判别分析就无意义作判别分析就无意义.假设检验的基本步骤为假设检验的基本步骤为假设检验的基本步骤为假设检验的基本步骤为:第一步第一步第一步第一步:提出待检验的假设提出待检验的假设提出待检验的假设提出待检验的假设第二步:给出检验用的统计量及统计量服从的分布第二步:给出检验用的统计量及统计量服从的分布第三步第三步:给定检验水平给定检验水平,查统计查统计量的分布表,得到量的分布
3、表,得到临临界界值值,从而得到否,从而得到否定域定域第四步:根据第四步:根据样样本本观测值计观测值计算算统计统计量的量的值值,看是否落入否定域。,看是否落入否定域。第一节 均值向量的检验一、一元正态分布总体均值检验的回顾一、一元正态分布总体均值检验的回顾(一)单个正态总体均值的检验设从总体 一元正态总体中抽取样本容量为n的样本,每个样本只观察一个指标,用xi表示,现检验1.当 已知时,检验用的统计量为2、当未知时,检验用的统计量为(二)两个正态总体均值的比较检验设从总体 中抽出一个样本,从总体 中抽出一个样本,要进行的假设检验为1.两个正态分布总体方差 和已知时,检验用的统计量2.两个正态分布
4、总体方差 和未知,但(三)多个正态总体均值的比较检验设有k个正态总体分别为 从k个总体中各自独立的抽取一个样本:各总体的样本如下:现要检验检验用的统计量为:(在H0成立时)其中:总离差平方和记:组间平方和 组内平方和(一)单个正态总体均值向量的检验二、多元正态分布总体均值向量的检验二、多元正态分布总体均值向量的检验设元正态总体 从总体中抽取容量为 n的样本现欲检验 1.总体协差阵 已知时均值向量的检验 检验用的统计量为:2.总体协差阵 未知时均值向量的检验 Hotelling 统计量统计量 例题1:人的出汗多少与人体内部纳和钾的含量有一定的关系,今测20名健康成年女性的出汗多少X1、钠的含量X
5、2和钾的含量X3,其数据如下表:序号序号X1X2X313.748.59.325.765.1833.847.210.943.253.21253.155.59.764.636.17.972.424.81487.233.17.696.747.48.5105.454.111.3113.936.912.7124.558.812.3133.527.89.8144.540.28.4151.513.510.1168.556.47.1174.571.68.2186.552.810.9194.144.111.2205.540.99.4A=0.05通过计算认为样本均值向量与已知均值向量无显著差别。(二)两个正态总体
6、均值向量的检验设 为来自元正态总体 容量为 n的样本为来自元正态总体 容量为 m的样本且两样本之间相互独立 假定两总体协方差矩阵相等,现对假设1.有共同已知协方差时,检验用的统计量为2.有共同未知协方差阵时,检验用的统计量为:(在H0成立时)调查某市15岁男女中学生若干名,测量其身体发育的三项指标:X1为身高,X2为体重,X3为胸围。检验该市中学15岁男女生身体发育状况有无显著性差别。男生 女生 序号序号X1X2X3序号序号X1X2X31171.058.581.01152.044.874.02175.065.087.02153.046.580.03159.038.071.03158.048.5
7、73.54155.345.074.04150.050.587.05152.035.063.05144.036.368.06158.344.575.06160.554.786.07154.844.574.07158.049.084.08164.051.072.08154.050.876.09165.255.079.09153.040.070.010164.546.071.010159.652.076.011159.148.072.51112164.246.573.012给定显著性水平 a=0.05设两组样本来自来自正态总体分别记为:两组样本相互独立,共同未知协差阵为拒绝原假设(三)多个多元正态总
8、体均值向量的检验定义1:若,则称协差阵的行列式为X的广义方差。称为样本的广义方差。其中:定义2:若为Wilks统计量,其所服从的分布是维数为p,第一自由度为n1、第二自由度为n2。显然,为两个广义方差之比。的Wilks分布,简记为鉴于分布的重要性,关于它的近似分布和精确分布不断有人研究,当p和n2=k-1中的一个比较小时,分布可化为F分布。下表是常见的情况:n1=n-kpn2=k-1FF的自由度任意1P,n1-p+1任意22P,2(n1-p)1任意n2,n12任意2n2,2(n1-1)当p,n2不属于上表情况时,Bartlett指出可用分布近似表示,即近似服从设有k个p元正态分布总体,它们的分
9、布分别是:从这k个总体中各自独立的抽取一个样本,样本个数分别为:,对每个样品观测p个指标,则:第一个样本总体为:第k个样本总体为:令现要检验检验用的统计量为:,(在H0成立时)为了研究销售方式对商品销售额的影响,选取四种商品(甲、乙、丙、丁)按不同的销售方式(、)进行销售,这四种商品的销售额分别为其数据见表 销售方式1销售方式2销售方式3X1X2X3X4X1X2X3X4X1X2X3X41125603382106654455310653348026021198023333082454032101003446829536351260203656531228065634162654655142915
10、040514772801174846825051306540320567544812931146339538066945350190385046821055305462357466058520042453511906451507320814666273250113403903101109044222598754585240805552020060624402481011077507270766050718911069377260111076036420094332602808878299360121306139120060514291907363390320138045429270554039
11、0295114554942401460504421906548481177103544163101581542602806948442225100332733121613587507260125633122701406131234517574840028512056416280803628625018755252026070454683701355446834519766540325062664162241306932536020554241117069603772806057273260检验在检验时假定这三个总体均为多元正态总体,并且它们的协方差矩阵相同。据题意:经计算得 拒绝原假设甲和丁存在显著差别第二节 协方差阵的检验一、检验一、检验 设是来自的样本是已知的正定矩阵,要检验检验用的统计量是对于方阵A=,将它对角线的所有元素相加所得的和,称为矩阵A的迹,记为trA=当及时的分位点表 二、二、检验检验 检验用的统计量是当不大且时,的上分位点