《[统计学]多元统计分析2第二章均值向量和协方差阵的检验课件.ppt》由会员分享,可在线阅读,更多相关《[统计学]多元统计分析2第二章均值向量和协方差阵的检验课件.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/1/91 多元统计分析多元统计分析中国人民大学中国人民大学出版社出版社2023/1/9中国人民大学六西格玛质量管理研究中心2第第二二章章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 2.1 均值向量的检验均值向量的检验2.2 协方差阵的检验协方差阵的检验2.3 形象分析形象分析2.4 有关检验的上机实现有关检验的上机实现2023/1/9中国人民大学六西格玛质量管理研究中心3第第二二章章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 以以做检验。做检验。2023/1/9中国人民大学六西格玛质量管理研究中心4第第二二章
2、章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 2023/1/9中国人民大学六西格玛质量管理研究中心5 目录 上页 下页 返回 结束 2.1 2.1 均值向量的检验均值向量的检验2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2.1.2 2.1.2 多元均值检验多元均值检验 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2.1.4 2.1.4 多总体均值的检验多总体均值的检验2023/1/9中国人民大学六西格玛质量管理研究中心6 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9
3、中国人民大学六西格玛质量管理研究中心7 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9中国人民大学六西格玛质量管理研究中心8 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9中国人民大学六西格玛质量管理研究中心9 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中心10 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中
4、心11 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中心12 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 ()协方差阵)协方差阵已知已知 类似于(类似于(2.32.3)的统计量(注意()的统计量(注意(2.32.3)的形式)是)的形式)是可以证明,在假设可以证明,在假设 为真时,统计量为真时,统计量 遵从自由度为遵从自由度为p p的的 分布;事实上由分布;事实上由1.5 1.5 2023/1/9中国人民大学六西格玛质量管理研究中心13 目录 上页 下页 返回 结束 2.1.2
5、 2.1.2 多元均值检验多元均值检验 统计量统计量 实质上是样本均值实质上是样本均值 与已知平均水平与已知平均水平 之间的马之间的马氏距离的氏距离的 倍,这个值越大,倍,这个值越大,与与 相等的可能性就越小,相等的可能性就越小,因而,在备择假设因而,在备择假设 成立时,成立时,有变大的趋势,所以拒绝域应有变大的趋势,所以拒绝域应取为取为 值较大的右侧部分。式中值较大的右侧部分。式中 是样本均值,是样本均值,是样本容量。是样本容量。当给定显著性水平当给定显著性水平 后,由样本值可以算出后,由样本值可以算出 的值,当的值,当时,便拒绝零假设时,便拒绝零假设 ,说明均值,说明均值不等于不等于 ,其
6、中,其中 是是自由度为自由度为P P的的 分布的分为点。即分布的分为点。即2023/1/9中国人民大学六西格玛质量管理研究中心14 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 ()协方差阵)协方差阵未知未知 此时此时的无偏估计是的无偏估计是 ,类似于式(,类似于式(2.3)的统计量是:的统计量是:可以证明,统计量遵从参数为可以证明,统计量遵从参数为p p,n n-1,-1,,的,的 分布,即分布,即 。统计量。统计量 实际上也是样本均值实际上也是样本均值 与已知均值向量与已知均值向量 之间的之间的马氏距离再乘以马氏距离再乘以n n(n n-1)-1),这个值
7、越大,这个值越大,与与 相等的可能性相等的可能性就越小。就越小。2023/1/9中国人民大学六西格玛质量管理研究中心15 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 因而,在备择假设成立时,因而,在备择假设成立时,的值有变大的趋势,所以的值有变大的趋势,所以拒绝域可取为拒绝域可取为 值较大的右侧部分。因此,当给定显著性值较大的右侧部分。因此,当给定显著性水平水平 后,由样本的数值可立即算出后,由样本的数值可立即算出 值,当值,当时,便拒绝零假设时,便拒绝零假设 。分布的分布的5%5%及及1%1%的分位点已列成专表,由网上下载,的分位点已列成专表,由网上下载,
8、为为 的上的上 分位点。分位点。2023/1/9中国人民大学六西格玛质量管理研究中心16 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 由由1.51.5,将,将 统计量乘上一个适当的常数后,便成为统计量乘上一个适当的常数后,便成为F F 统计量,也可用统计量,也可用F F分布表获得零假设的拒绝域。即分布表获得零假设的拒绝域。即关于关于 、的合理性及推证见参考文献的合理性及推证见参考文献33 在实际工作中,一元检验与多元检验可以联合使用,在实际工作中,一元检验与多元检验可以联合使用,多元的检验具有概括和全面考察的特点,而一元的检验多元的检验具有概括和全面考察的特
9、点,而一元的检验容易发现各指标之间的关系和差异,能帮助我们找出存容易发现各指标之间的关系和差异,能帮助我们找出存在差异的侧重面,提供了更多的统计分析信息。在差异的侧重面,提供了更多的统计分析信息。2023/1/9中国人民大学六西格玛质量管理研究中心17 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 在许多实际问题中,往往要比较两个总体之间的在许多实际问题中,往往要比较两个总体之间的平均水平有无差异。例如,两所大学新生录取成绩是平均水平有无差异。例如,两所大学新生录取成绩是否有明显差异;研究职工工资总额的构成情况,若按否有明显差异;研究职工工资总额的构成
10、情况,若按国民经济行业分组,就是例如要研究工业与建筑业这国民经济行业分组,就是例如要研究工业与建筑业这两个行业之间,是否有明显的不同之处;同理,可按两个行业之间,是否有明显的不同之处;同理,可按工业领导关系(中央、省、市、县属工业)分组;也工业领导关系(中央、省、市、县属工业)分组;也可按工业行业分组。组与组之间的工资总额构成有无可按工业行业分组。组与组之间的工资总额构成有无显著差异,本质上就是两个总体的均值向量是否相等,显著差异,本质上就是两个总体的均值向量是否相等,这类问题,通常也称为两样本问题。两总体均值比较这类问题,通常也称为两样本问题。两总体均值比较的问题,又可分为两总体协方差阵相等
11、与两总体协方的问题,又可分为两总体协方差阵相等与两总体协方差阵不等两种情形。差阵不等两种情形。2023/1/9中国人民大学六西格玛质量管理研究中心18 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 1.1.协方差阵相等的情形协方差阵相等的情形进行检验。与前面类似的统计量的形式是进行检验。与前面类似的统计量的形式是:设设 为来自为来自p p元正态元正态总体总体 的容量为的容量为 的样本,的样本,是来自是来自p p元正态总体元正态总体 容量为容量为 的样的样本,且两样本之间相互独立,本,且两样本之间相互独立,假定两总体协假定两总体协方差阵相等,但未知,现对
12、假设方差阵相等,但未知,现对假设 2023/1/9中国人民大学六西格玛质量管理研究中心19 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2023/1/9中国人民大学六西格玛质量管理研究中心20 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 因为因为 的值与总体均值的马氏距离的值与总体均值的马氏距离 成正成正比例,此值愈大,说明两总体的均值很接近的可能性就愈小,比例,此值愈大,说明两总体的均值很接近的可能性就愈小,因而拒绝域可以取为因而拒绝域可以取为 值较大的右侧区域,即当给定显著性水值较大的右侧区域,即当给定
13、显著性水平平 的值时,若的值时,若时,拒绝时,拒绝 ,否则没有足够理由拒绝,否则没有足够理由拒绝 。2023/1/9中国人民大学六西格玛质量管理研究中心21 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2.2.协方差阵不相等情形协方差阵不相等情形 设从两个总体设从两个总体 和和 ,分别抽,分别抽取容量为取容量为 和和 的两个样本,的两个样本,假定两总体协方差阵不相等,我们考假定两总体协方差阵不相等,我们考虑对假设(虑对假设(2.92.9)作检验。这是著名)作检验。这是著名BehrensBehrensFisherFisher问题。长期以来,统计学家用许
14、多方法试问题。长期以来,统计学家用许多方法试图解决这个问题。当图解决这个问题。当 与与 相差较大时,相差较大时,统计量统计量的形式是的形式是:2023/1/9中国人民大学六西格玛质量管理研究中心22 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 式中,式中,的统计含义与前相同,再令的统计含义与前相同,再令2023/1/9中国人民大学六西格玛质量管理研究中心23 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 当假设(当假设(2.92.9)的)的 成立时,可以证明(见文献成立时,可以证明(见文献3)3)近似遵从第一
15、自由度为近似遵从第一自由度为 、第二自由度为、第二自由度为 的的F F分布,即分布,即2023/1/9中国人民大学六西格玛质量管理研究中心24 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验 在许多实际问题中,我们要研究的总体往往在许多实际问题中,我们要研究的总体往往不止两个。例如,要对全国的工业行业的生产经不止两个。例如,要对全国的工业行业的生产经营状况做一比较时,一个行业可以看成一个总体,营状况做一比较时,一个行业可以看成一个总体,此时要研究的总体就达几十甚至几百个之多。这此时要研究的总体就达几十甚至几百个之多。这类问题的研究就需要多元方差分析的知识
16、。多元类问题的研究就需要多元方差分析的知识。多元方差分析是一元方差分析的直接推广,为了易于方差分析是一元方差分析的直接推广,为了易于理解多元方差分析的方法,我们先回顾理解多元方差分析的方法,我们先回顾一元的方一元的方差分析。差分析。2023/1/9中国人民大学六西格玛质量管理研究中心25 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验 假设r个总体的方差相等,要检验的假设就是2023/1/9中国人民大学六西格玛质量管理研究中心26 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验这个检验的统计量与下列平方和密切相关这
17、个检验的统计量与下列平方和密切相关2023/1/9中国人民大学六西格玛质量管理研究中心27 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验2023/1/9中国人民大学六西格玛质量管理研究中心28 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验用类似于一元方差分析的办法,前面所述的三个平方和变成了用类似于一元方差分析的办法,前面所述的三个平方和变成了矩阵,形式如下:矩阵,形式如下:很显然很显然W W=B B+E E关于的检验可用关于的检验可用Wilks Wilks 分布分布,再化为再化为F F分布分布,详细参考详细参
18、考1.51.5节节2023/1/9中国人民大学六西格玛质量管理研究中心29 目录 上页 下页 返回 结束 2.2 协方差阵的检验协方差阵的检验2.2.1 2.2.1 检验检验2.2.2 2.2.2 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心30 目录 上页 下页 返回 结束 2.2 协方差阵的检验协方差阵的检验 上面讨论了多元正态分布均值的检验。但这仅上面讨论了多元正态分布均值的检验。但这仅仅研究了问题的一个方面,倘若要进一步深究不同仅研究了问题的一个方面,倘若要进一步深究不同总体的平均水平(均值)波动的幅度,前面介绍的总体的平均水平(均值)波动的幅度,前面介绍的方法就无能为
19、力了。本节所介绍的协方差阵的检验方法就无能为力了。本节所介绍的协方差阵的检验可以解决该类问题可以解决该类问题2023/1/9中国人民大学六西格玛质量管理研究中心31 目录 上页 下页 返回 结束 2.2.1 2.2.1 检验检验是样本协方差阵,关于统计量是样本协方差阵,关于统计量M M的推证过程见参考文献的推证过程见参考文献11。其中其中2023/1/9中国人民大学六西格玛质量管理研究中心32 目录 上页 下页 返回 结束 2.2.1 2.2.1 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心33 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验 上面讨论的检验上面
20、讨论的检验 ,是帮助我们分析当前,是帮助我们分析当前的波动幅度与过去的波动情形有无显著差异。但在的波动幅度与过去的波动情形有无显著差异。但在实际问题中,我们往往面临多个总体,需要了解这实际问题中,我们往往面临多个总体,需要了解这多个总体之间的波动幅度有无明显的差异。例如在多个总体之间的波动幅度有无明显的差异。例如在研究职工工资构成时,若按工业行业分组,就有采研究职工工资构成时,若按工业行业分组,就有采掘业、制造业、文化教育、金融保险等,不同行业掘业、制造业、文化教育、金融保险等,不同行业间工资总额的构成存在波动,研究波动是否存在显间工资总额的构成存在波动,研究波动是否存在显著的差异,就是做行业
21、间协方差阵相等性的检验。著的差异,就是做行业间协方差阵相等性的检验。用统计理论来描述就是:用统计理论来描述就是:设有设有r r个总体,从各个总体中抽取样品如下:个总体,从各个总体中抽取样品如下:2023/1/9中国人民大学六西格玛质量管理研究中心34 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心35 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验 当当 不大且不大且 时时,本书附表本书附表4 4中列出了中列出了M M 的的上上 分位点分位点;若若 较大且较大且 互不相当时互不相当时,附表附表4 4中未列出它们
22、中未列出它们对应的临界值对应的临界值,此时可用此时可用F F分布去近似分布去近似,M M 近似遵从近似遵从 ,记记作作 M M (2.22)(2.22)2023/1/9中国人民大学六西格玛质量管理研究中心36 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验其中其中2023/1/9中国人民大学六西格玛质量管理研究中心37 目录 上页 下页 返回 结束 2.3 2.3 形象分析形象分析2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论2.3.3 2.3.3 多个总体的形象分析多个总体的形象分析 2.3.4 2.3
23、.4 需要注意的问题需要注意的问题 上面我们论述了多个遵从多元正态分布的总体的均值比较问上面我们论述了多个遵从多元正态分布的总体的均值比较问题,在实际研究中,人们常常需要对来自两正态总体的样本做题,在实际研究中,人们常常需要对来自两正态总体的样本做更细致的分析。比如,比较两总体各个指标之间变动的幅度是更细致的分析。比如,比较两总体各个指标之间变动的幅度是否相等,进一步,如果两总体各指标之间的变量幅度相等,比否相等,进一步,如果两总体各指标之间的变量幅度相等,比较两总体的均值是否相等,更进一步,当通过了两总体均值相较两总体的均值是否相等,更进一步,当通过了两总体均值相等的假设之后,检验两总体各个
24、指标的取值是否相等。统计学等的假设之后,检验两总体各个指标的取值是否相等。统计学家将对这类问题的解决方法归结为本节所讲的形象分析家将对这类问题的解决方法归结为本节所讲的形象分析(Profile AnalysisProfile Analysis)。形象分析广泛地用于实验设计数据的)。形象分析广泛地用于实验设计数据的检验,同时,也可应用于其他领域对多个指标的比较研究。本检验,同时,也可应用于其他领域对多个指标的比较研究。本节主要讲述形象分析的基本思想,分析过程及用节主要讲述形象分析的基本思想,分析过程及用SPSSSPSS软件进行软件进行形象分析的方法。形象分析的方法。2023/1/9中国人民大学六
25、西格玛质量管理研究中心38 目录 上页 下页 返回 结束 2.3 2.3 形象分析形象分析2023/1/9中国人民大学六西格玛质量管理研究中心39 目录 上页 下页 返回 结束 2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想 形象(形象(profileprofile)又称轮廓图,是将总体样本的均值绘制到)又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点,若总体有一点,若总体有 个指标,则其形象即由坐标轴里个指标,则其形象即由坐标轴里 个点连接个点连接而成。注意这里的而成。注意这里的
26、 个指标必须是同类可比指标,否则不能画个指标必须是同类可比指标,否则不能画到一个坐标里面。到一个坐标里面。形象分析即是将两(多)总体的形象绘制到同一坐标下,形象分析即是将两(多)总体的形象绘制到同一坐标下,根据形象(轮廓图)的形状对总体的均值进行比较分析。根据形象(轮廓图)的形状对总体的均值进行比较分析。设我们要对设我们要对 A、B 两个多元正态总体(方差相等)的两个多元正态总体(方差相等)的 个个同类指标作比较,分别从两总体随机抽取同类指标作比较,分别从两总体随机抽取 、个样本,将样本个样本,将样本均值作图得到如均值作图得到如 图图2-1所示的形象:所示的形象:2023/1/9中国人民大学六
27、西格玛质量管理研究中心40 目录 上页 下页 返回 结束 2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想 由上面的轮廓图可以清楚地看到,两总体的形象大体平由上面的轮廓图可以清楚地看到,两总体的形象大体平行,也就是说,行,也就是说,个指标的变动幅度大致相等,是否如此还个指标的变动幅度大致相等,是否如此还须得到统计检验才能下结论。须得到统计检验才能下结论。图图2-12-1两总体的形象图两总体的形象图2023/1/9中国人民大学六西格玛质量管理研究中心41 目录 上页 下页 返回 结束 2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想 进一步,若两总体形象平行的假设被接受,
28、我们进一步,若两总体形象平行的假设被接受,我们还想知道两总体的形象是否重合,即两总体均值是否还想知道两总体的形象是否重合,即两总体均值是否相等。更进一步,若两总体均值相等,那么两总体的相等。更进一步,若两总体均值相等,那么两总体的形象是否水平,即这形象是否水平,即这 个指标之间是否有显著差异呢个指标之间是否有显著差异呢?形象分析就是针对这些问题,借助于方差分析的思?形象分析就是针对这些问题,借助于方差分析的思想,依次提出两总体形象平行、重合、水平的假设,想,依次提出两总体形象平行、重合、水平的假设,然后选择合适的统计量对这三个假设进行检验的分析。然后选择合适的统计量对这三个假设进行检验的分析。
29、2023/1/9中国人民大学六西格玛质量管理研究中心42 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 设设 均值向量均值向量 ,,均值向量均值向量 ,则针对上面的问题,相应的假设的则针对上面的问题,相应的假设的形式与检验统计量如下所述:形式与检验统计量如下所述:1.两总体形象平行的假设与检验统计量:两总体形象平行的假设与检验统计量:(2.23)(2.23)2023/1/9中国人民大学六西格玛质量管理研究中心43 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 令令C C为如下为如下 阶对照阵阶对照阵则上
30、面的假设可写为:则上面的假设可写为:(2.24)(2.24)或者写为或者写为 ,这里这里 为各分量全为为各分量全为1 1的的 维列向量。维列向量。可以看作是两总体之间的平均差异。可以看作是两总体之间的平均差异。2023/1/9中国人民大学六西格玛质量管理研究中心44 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 设从总体设从总体 中取得中取得 个样本,从总体个样本,从总体 中取得中取得 个样本,个样本,令令 、及及 分别代表两总体的样本均值向量及协方差阵,分别代表两总体的样本均值向量及协方差阵,总体方差总体方差 的估计形式为:的估计形式为:(2.2
31、5(2.25)则若:则若:拒绝拒绝 ,否则没有足够理由拒绝,认为两总体的形象平行,否则没有足够理由拒绝,认为两总体的形象平行,若假设若假设 被接受,则我们可以继续对下面两个假设给予检验被接受,则我们可以继续对下面两个假设给予检验.2023/1/9中国人民大学六西格玛质量管理研究中心45 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 2.2.两总体的形象重合的假设与检验统计量两总体的形象重合的假设与检验统计量 (2.26)由前所述,由前所述,反映了两总体之间的平均差异程度,因此反映了两总体之间的平均差异程度,因此可以求出可以求出 的置信区间,若所求置
32、信区间显著不包括的置信区间,若所求置信区间显著不包括0 0,则,则说明两总体均值有明显差异,即拒绝两总体形象重合的假设,说明两总体均值有明显差异,即拒绝两总体形象重合的假设,反之,没有足够理由拒绝反之,没有足够理由拒绝 ,认为两总体形象是重合的。,认为两总体形象是重合的。的极大似然估计为:的极大似然估计为:(2.27)(2.27)2023/1/9中国人民大学六西格玛质量管理研究中心46 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 的置信区间:(2.28)(2.28)其中:若0在上述置信区间内,则可以考虑接受,否则,拒绝。2023/1/9中国人民大
33、学六西格玛质量管理研究中心47 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 实际上,在通过了两总体形象平行的前提下,对两总体实际上,在通过了两总体形象平行的前提下,对两总体形象重合的假设检验有更简单的形式。设假设形象重合的假设检验有更简单的形式。设假设 已经通过,已经通过,则对于任意的则对于任意的 (),),与与 必居其一,必居其一,于是,两总体形象重合,当且仅当于是,两总体形象重合,当且仅当 =。因此,检验两。因此,检验两总体形象重合,等价于检验如下假设:总体形象重合,等价于检验如下假设:(2.29)于是,将从总体于是,将从总体 中取得每一个样
34、品各指标值相加,得到各指中取得每一个样品各指标值相加,得到各指标和的标和的 个数据个数据 (),对从总体对从总体 中取得的中取得的 个样品作同样的加工,得到个样品作同样的加工,得到 个数据个数据 ()。)。2023/1/9中国人民大学六西格玛质量管理研究中心48 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 利用两个一元正态总体均值检验中方差相等但未知的情利用两个一元正态总体均值检验中方差相等但未知的情况的检验方法,构造如下统计量:况的检验方法,构造如下统计量:(2.30)式中,式中,的定义如上,若的定义如上,若 ,或者,或者 则拒绝则拒绝 ,否则
35、没有足够理由拒绝,认为两总体形象重合。,否则没有足够理由拒绝,认为两总体形象重合。两总体形象重合的检验通过之后,可以进行如下两总体形象两总体形象重合的检验通过之后,可以进行如下两总体形象水平的检验。水平的检验。2023/1/9中国人民大学六西格玛质量管理研究中心49 目录 上页 下页 返回 结束 2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论 3.两总体形象水平的假设及检验统计量两总体形象水平的假设及检验统计量 在两总体形象重合的假设通过检验时,这两个正态总体实在两总体形象重合的假设通过检验时,这两个正态总体实际上是来自同一总体。将所得到的际上是来自同一总体。将所得到的 个数据合
36、并,个数据合并,令令 ,则,则 为所有观测的总平均向量,总体形象水平的假设如下:为所有观测的总平均向量,总体形象水平的假设如下:(2.31)若:(2.32)则拒绝则拒绝 ;否则,可以考虑接受,认为总体的形象是水平;否则,可以考虑接受,认为总体的形象是水平的,即的,即 个指标的取值是相等的。个指标的取值是相等的。2023/1/9中国人民大学六西格玛质量管理研究中心50 目录 上页 下页 返回 结束 2.3.3 2.3.3 多个总体的形象分析多个总体的形象分析 设有设有 个总体,从每个总体中取得个总体,从每个总体中取得 个样品,对每个样品观个样品,对每个样品观测测 个指标,所得观测数据如下表示:个
37、指标,所得观测数据如下表示:其中,假定 令:则关于则关于 这个总体形象平行、重合、水平的假设提法及检验这个总体形象平行、重合、水平的假设提法及检验统计量如下。统计量如下。2023/1/9中国人民大学六西格玛质量管理研究中心51 目录 上页 下页 返回 结束 2.3.3 2.3.3 多个总体的形象分析多个总体的形象分析 1.1.各总体形象平行各总体形象平行 (2.33)检验统计量为:检验统计量为:(2.34)其中,矩阵其中,矩阵 的定义同前。当的定义同前。当 成立时,成立时,遵从遵从WilksWilks分布分布 ,在显著性水平,在显著性水平 下,若下,若 ,则拒绝,则拒绝 ;否;否则可以考虑接受
38、,认为则可以考虑接受,认为 个总体的形象是平行的。个总体的形象是平行的。2023/1/9中国人民大学六西格玛质量管理研究中心52 目录 上页 下页 返回 结束 2.3.3 2.3.3 多个总体的形象分析多个总体的形象分析 2.2.各总体的形象重合:各总体的形象重合:(2.35)则在显著性水平则在显著性水平 下,若下,若则拒绝则拒绝 ;否则可以考虑接受,认为;否则可以考虑接受,认为 个总体个总体的形象是重合的。的形象是重合的。2023/1/9中国人民大学六西格玛质量管理研究中心53 目录 上页 下页 返回 结束 2.3.4 2.3.4 需要注意的问题需要注意的问题 进行形象分析的首要条件就是各指
39、标的均值能在一进行形象分析的首要条件就是各指标的均值能在一张图上画出来,也就是说,各指标必须是同类的,否张图上画出来,也就是说,各指标必须是同类的,否则总体则总体“形象形象”的概念就没有意义,更谈不上的概念就没有意义,更谈不上“水平水平”了,这同时也要求各指标的取值应该在同一量级,了,这同时也要求各指标的取值应该在同一量级,形象分析的结果受到变量量纲的影响。另外,要求不形象分析的结果受到变量量纲的影响。另外,要求不同总体的协方差矩阵至少是相等的,这一点在上面检同总体的协方差矩阵至少是相等的,这一点在上面检验的过程中可以看出来。验的过程中可以看出来。2023/1/9中国人民大学六西格玛质量管理研
40、究中心54 目录 上页 下页 返回 结束 2.4 有关检验的上机实现有关检验的上机实现2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 2.4.2 2.4.2 形象分析的上机实现形象分析的上机实现 2023/1/9中国人民大学六西格玛质量管理研究中心55 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验【例例2.12.1】1999 1999年财政部、国家经贸委、人事部和国家计委年财政部、国家经贸委、人事部和国家计委联合发布了联合发布了国有资本金效绩评价规则国有资本金效绩评价规则。其中,对竞争性。其中,对竞争性工商企业的评价指标体系包
41、括下面八大基本指标:净资产收工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分我们借助于这一指标体系对我国上市公司的运营情况进行分析,表析,表2-12-1所列的是所列的是3535家上市公司家上市公司20002000年年报数据,这年年报数据,这3535家上家上市公司分别来自于电力、煤气及水的生产和供应业,房地行市公司分别来自于电力、煤气及
42、水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分业,信息技术业,在后面各章中也经常以该数据为例进行分析。析。2023/1/9中国人民大学六西格玛质量管理研究中心56 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 行业公司简称净资产收益率%总资产报酬率%资产负债率%总资产周转率流动资产周转率已获利息倍数销售增长率%资本积累率%电力、煤气及水的生产和供应业深能源16.8512.35 42.32 0.37 1.78 7.18 45.73 54.54 深南电2215.30 46.51 0.76 1.77 15.67 48.1
43、1 19.41 富龙热力8.977.98 30.56 0.17 0.58 10.43 17.80 9.44 穗恒运10.258.99 40.44 0.46 2.46 5.06 11.06 1.09 粤电力20.8120.00 35.87 0.43 1.25 34.89 24.77 12.67 韶能股份8.867.52 27.59 0.24 0.84 20.59-3.50 54.02 惠天热电10.987.94 49.30 0.36 0.69 12.43 16.88 3.52 原水股份8.858.88 36.20 0.13 0.41 8.53-11.49 2.44 大连热电9.037.41 46
44、.89 0.28 0.79 6.86 16.23-1.52 龙电股份12.078.70 16.81 0.28 0.68 29.75 4.11 63.06 华银电力6.856.12 41.93 0.24 0.65 4.38 11.20 3.80 表表2-12023/1/9中国人民大学六西格玛质量管理研究中心57 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 续前表续前表房地产行业长春经开9.8510.50 31.23 0.34 0.40 17.13 18.05 7.18 兴业房产1.071.52 66.91 0.21 0.24 1.53-31.9
45、3 1.08 金丰投资19.447.01 73.34 0.26 0.30 7.02 71.22 12.73 新 黄 浦7.615.92 39.64 0.16 0.17 4.20 14.77 7.91 浦东金桥4.243.99 37.30 0.20 0.25 3.98-9.24 4.69 外 高 桥1.6731.92 49.05 0.03 0.05 1.06-21.74 0.24 中华企业8.786.28 57.42 0.17 0.19 3.58 75.29 2.93 渝开发0.22.24 63.40 0.09 0.15 1.07-12.56 0.29 辽 房 天8.123.98 69.10 0
46、.10 0.72 2.65-35.83 3.16 粤宏远0.421.16 37.42 0.09 0.15 1.59 19.18 0.43 ST中福5.176.62 65.48 0.16 0.21 1.33-19.91 23.74 倍特高新0.722.76 65.39 0.30 0.42 1.24 8.40 0.70 三木集团5.994.53 65.17 0.74 0.88 4.14 75.36 0.87 寰岛实业0.420.20 24.03 0.02 0.03-8.18-71.33 0.42 中 关 村9.324.48 67.76 0.32 0.37 16.42-29.42 4.09 2023
47、/1/9中国人民大学六西格玛质量管理研究中心58 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 续前表续前表信息技术业中兴通讯18.7811.09 69.15 0.93 1.08 4.79 80.80 23.27 长城电脑14.949.48 45.53 1.14 1.85 9.51 34.47 35.93 青鸟华光9.7888.70 36.67 0.28 0.39 13.11 28.36 7.87 清华同方15.919.08 34.19 0.85 1.19 15.61 98.92 95.66 永鼎光缆9.48.67 32.75 0.79 1.2
48、5 13.49 41.75 6.33 宏图高科14.577.96 65.86 0.76 0.94 3.95 54.45 15.71 海星科技4.063.35 36.49 0.48 0.60 4.64-16.28 1.69 方正科技27.4816.69 57.13 2.51 2.87 7.40 63.27 32.02 复华实业5.584.10 44.24 0.28 0.41 3.77 12.92 2.30 2023/1/9中国人民大学六西格玛质量管理研究中心59 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 注:注:1.1.该表中,除大连热电的数
49、据为母公司数据外,其他数据均来自该表中,除大连热电的数据为母公司数据外,其他数据均来自于合并会计报表;于合并会计报表;2.2.除辽房天及中兴通讯外,其他公司的净资产收益率均为加权后除辽房天及中兴通讯外,其他公司的净资产收益率均为加权后的数值;的数值;3 3除净资产收益率指标为直接取自会计年报外,其他各指标均是除净资产收益率指标为直接取自会计年报外,其他各指标均是经过各企业年报提供数字计算而得,各指标的计算公司如下:经过各企业年报提供数字计算而得,各指标的计算公司如下:2023/1/9中国人民大学六西格玛质量管理研究中心60 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的
50、检验均值及协方差阵的检验 d.d.e.e.f.f.g.g.2023/1/9中国人民大学六西格玛质量管理研究中心61 目录 上页 下页 返回 结束 2.4.1 2.4.1 均值及协方差阵的检验均值及协方差阵的检验 本书上机实现主要以本书上机实现主要以SPSS10.07SPSS10.07版本为例,在版本为例,在SPSSSPSS软件的数软件的数据窗口依次定义变量,并输入以上数据。在上面的数据中,不据窗口依次定义变量,并输入以上数据。在上面的数据中,不同的行业可以看作是不同的总体,因此,同的行业可以看作是不同的总体,因此,3535个数据分别来自于个数据分别来自于3 3个总体,下面尝试对个总体,下面尝试