《第四章多元正态分布的统计推断精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章多元正态分布的统计推断精选文档.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章多元正态分布的统计推断本讲稿第一页,共四十四页 1 单因素方差分析问题的提出统计的模型及检验方法多重比较检验本讲稿第二页,共四十四页问题的提出本讲稿第三页,共四十四页某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。a=0.05,0.01。早班中班晚班344939374740355142334839335041355142365140本讲稿第四页,共四十四页为什么各值会有差异?可能的原因有两个。一是,各个班次工人的劳动效率可能有差异,从而导致
2、了不同水平下的观察值之间差异,即存在条件误差。二是,随机误差的存在。如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:本讲稿第五页,共四十四页三个班次工人的平均劳动效率分别为:总离差平方和ss组间离差平方和(条件误差)ssA本讲稿第六页,共四十四页组内离差平方和(随机误差)sse统计量F本讲稿第七页,共四十四页把计算的F值与临界值比较,当FF时,拒绝原假设,不同水平下的效应有显著性差异;当FF时,接受原假设。方差来源离差平方和自由度方差F值组间A组内E总和NEXT本讲稿第八页,共四十四页查F分布表得临界值因为故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。方差分析:比较3个或3个以
3、上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。NEXT本讲稿第九页,共四十四页 50家上市公司,按行业计算其1999年底的资产负债情况,如下:序号制造业商业运输业公用事业房地产业165905025702559565307535090584560445936350805409264406565890602570760855830728758856307698090603568106092552566平均58.890.558.933.570.2本讲稿第十页,共四十四页 本讲稿第十一页,共四十四页
4、多重比较检验 1、多重比较检验 前面的F检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设:因而还应该进一步讨论到底是哪些总体之间存在差异。本讲稿第十二页,共四十四页 Scheffe检验检验的结论:本讲稿第十三页,共四十四页本讲稿第十四页,共四十四页2 多元方差分析一、假设本讲稿第十五页,共四十四页二、多元方差分析的离差平方和的分解总离差平方和 本讲稿第十六页,共四十四页本讲稿第十七页,共四十四页由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵 组内叉积矩阵:主要由随机因素构成组间叉积矩阵:主要由
5、系统因素构成本讲稿第十八页,共四十四页 SSE和SS(TR)之和等于总离差平方和SST。当SSE在SST中占有较大的份额时,可以认为随机因素影响过大,反之SSE所占份额小,SS(RT)所占份额就大,不同试验间的观测值会有显著性差异。三、统计量本讲稿第十九页,共四十四页对给定的显著性水平,检验规则为:拒绝原假设;接受原假设;本讲稿第二十页,共四十四页单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验是取自该总体的样本。检验:一、问题引入例 设本讲稿第二十二页,共四十四页与上面的假设等价的是,寻找常数矩阵本讲稿第二十三页,共四十四页 注:矩阵C不是唯一的,本讲稿第二十四页,共四十四页
6、 在例4.2.1中,假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:本讲稿第二十五页,共四十四页则上面的假设可以表达为 本讲稿第二十六页,共四十四页二、统计量及方法 其 中 C为 一 已 知 的 kp阶 矩 阵,kp,rank(C)=K,为已知的K维向量。根据多元正态分布的性质可知,检验:本讲稿第二十七页,共四十四页 当 为真时,故可以将霍特林分布的统计量换算成F统计量。本讲稿第二十八页,共四十四页 对给定的显著性水平,检验的规则 本讲稿第二十九页,共四十四页某地区农村男婴的体格测量数据如下编号身高(cm)胸围(cm)上半臂长(cm
7、)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0检验三个指标的均值是否有关系本讲稿第三十页,共四十四页本讲稿第三十一页,共四十四页4 两个总体均值的检验两个总体均值的检验一、两个独立样本的情形一、两个独立样本的情形 与一元随机变量的情形相同,常常我们需要检验两个总体的均值是否相等。设从总体 ,中各自独立地抽取样本 和 ,。考虑假设 本讲稿第三十二页,共四十四页 根据两个样本可得1和2的无偏估计量为其中本讲稿第三十三页,共四十四页当原假设为真的条件下,检验的规则为:本讲稿第三十四页,共四十四页二、成对试验的T2
8、统计量 n 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。思考:两独立样本和成对样本的观测值有何不同。本讲稿第三十五页,共四十四页 设(xi,yi),),i=1,2,3,n,时成对的试验数据,由于总体X X和Y Y均服从p维正态分布,且协方差相等。假设检验 本讲稿第三十六页,共四十四页 检验的统计量为 其中 当原假设为真时本讲稿第三十七页,共四十四页例1 一组学生共5人,采用两种不同的方式进行教学,然后对5个学生进行测验,得如下得分数:学生序号教学方式AB数学物理数学物理1899082852
9、98888083375696170476706766590766365分析不同的教学方式是否有差异。本讲稿第三十八页,共四十四页5 两个总体均值分量间结构关系的检验两个总体均值分量间结构关系的检验 一、问题提出 设从总体 ,中各自独立地抽取样本 和 ,。他们的均值向量差为:本讲稿第三十九页,共四十四页 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些
10、、很大和非常大5个等级,得到结果如表。本讲稿第四十页,共四十四页丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555本讲稿第四十一页,共四十四页 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。本讲稿第四十二页,共四十四页二、统计量与检验 检验 在原假设为真的条件下,检验的统计量为:本讲稿第四十三页,共四十四页本讲稿第四十四页,共四十四页