《多元正态分布的统计推断精选PPT.ppt》由会员分享,可在线阅读,更多相关《多元正态分布的统计推断精选PPT.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于多元正态分布的统计推断第1页,讲稿共45张,创作于星期日 1 单因素方差分析问题的提出统计的模型及检验方法多重比较检验第2页,讲稿共45张,创作于星期日问题的提出第3页,讲稿共45张,创作于星期日某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。a=0.05,0.01。早班中班晚班344939374740355142334839335041355142365140第4页,讲稿共45张,创作于星期日为什么各值会有差异?可能的原因有两个。一是,各个
2、班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。二是,随机误差的存在。如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:第5页,讲稿共45张,创作于星期日三个班次工人的平均劳动效率分别为:总离差平方和ss组间离差平方和(条件误差)ssA第6页,讲稿共45张,创作于星期日组内离差平方和(随机误差)sse统计量F第7页,讲稿共45张,创作于星期日把计算的F值与临界值比较,当FF时,拒绝原假设,不同水平下的效应有显著性差异;当FF时,接受原假设。方差来源离差平方和自由度方差F值组间A组内E总和NEXT第8页,讲稿共45张,创作于星期日查F分布表得临界值因为故
3、应拒绝原假设,即不同班次工人的劳动效率有显著的差异。方差分析:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。NEXT第9页,讲稿共45张,创作于星期日 50家上市公司,按行业计算其1999年底的资产负债情况,如下:序号制造业商业运输业公用事业房地产业165905025702559565307535090584560445936350805409264406565890602570760855830728758856307698090603568106092552566平均58
4、.890.558.933.570.2第10页,讲稿共45张,创作于星期日第11页,讲稿共45张,创作于星期日多重比较检验 1、多重比较检验 前面的F检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设:因而还应该进一步讨论到底是哪些总体之间存在差异。第12页,讲稿共45张,创作于星期日 Scheffe检验检验的结论:第13页,讲稿共45张,创作于星期日第14页,讲稿共45张,创作于星期日2 多元方差分析一、假设第15页,讲稿共45张,创作于星期日二、多元方差分析的离差平方和的分解总离差平方和 第16页,讲稿
5、共45张,创作于星期日第17页,讲稿共45张,创作于星期日由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵 组内叉积矩阵:主要由随机因素构成组间叉积矩阵:主要由系统因素构成第18页,讲稿共45张,创作于星期日 SSE和SS(TR)之和等于总离差平方和SST。当SSE在SST中占有较大的份额时,可以认为随机因素影响过大,反之SSE所占份额小,SS(RT)所占份额就大,不同试验间的观测值会有显著性差异。三、统计量第19页,讲稿共45张,创作于星期日对给定的显著性水平,检验规则为:拒绝原假设;接受原假设;第20页,讲稿共45张,创作于星期日单个总体均值分量间结构关系的检验单个总体均值分量间结
6、构关系的检验是取自该总体的样本。检验:一、问题引入例 设第22页,讲稿共45张,创作于星期日与上面的假设等价的是,寻找常数矩阵第23页,讲稿共45张,创作于星期日注:矩阵C不是唯一的,第24页,讲稿共45张,创作于星期日 在例4.2.1中,假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:第25页,讲稿共45张,创作于星期日则上面的假设可以表达为第26页,讲稿共45张,创作于星期日二、统计量及方法 其 中 C为 一 已 知 的 kp阶 矩 阵,kp,rank(C)=K,为已知的K维向量。根据多元正态分布的性质可知,检验:第27页,讲稿
7、共45张,创作于星期日当为真时,故可以将霍特林分布的统计量换算成F统计量。第28页,讲稿共45张,创作于星期日对给定的显著性水平,检验的规则第29页,讲稿共45张,创作于星期日某地区农村男婴的体格测量数据如下编号身高(cm)胸围(cm)上半臂长(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0检验三个指标的均值是否有关系第30页,讲稿共45张,创作于星期日第31页,讲稿共45张,创作于星期日4 两个总体均值的检验两个总体均值的检验一、两个独立样本的情形一、两个独立样本的情形 与一元随机变量的情形相同,常常
8、我们需要检验两个总体的均值是否相等。设从总体,中各自独立地抽取样本和,。考虑假设第32页,讲稿共45张,创作于星期日 根据两个样本可得1和2的无偏估计量为其中第33页,讲稿共45张,创作于星期日当原假设为真的条件下,检验的规则为:第34页,讲稿共45张,创作于星期日二、成对试验的T2统计量 n 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。思考:两独立样本和成对样本的观测值有何不同。第35页,讲稿共45张,创作于星期日 设(xi,yi),),i=1,2,3,n,时成对的试验数据,由于总体X
9、X和Y Y均服从p维正态分布,且协方差相等。假设检验第36页,讲稿共45张,创作于星期日检验的统计量为其中当原假设为真时第37页,讲稿共45张,创作于星期日例1一组学生共5人,采用两种不同的方式进行教学,然后对5个学生进行测验,得如下得分数:学生序号教学方式AB数学物理数学物理189908285298888083375696170476706766590766365分析不同的教学方式是否有差异。第38页,讲稿共45张,创作于星期日5 两个总体均值分量间结构关系的检验两个总体均值分量间结构关系的检验 一、问题提出设从总体,中各自独立地抽取样本和,。他们的均值向量差为:第39页,讲稿共45张,创作
10、于星期日 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。第40页,讲稿共45张,创作于星期日丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555第41页,讲稿共45张,创作于星期日 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。第42页,讲稿共45张,创作于星期日二、统计量与检验检验在原假设为真的条件下,检验的统计量为:第43页,讲稿共45张,创作于星期日第44页,讲稿共45张,创作于星期日感感谢谢大大家家观观看看第45页,讲稿共45张,创作于星期日