《第十四章多变量数据的统计描述与推断II课件.ppt》由会员分享,可在线阅读,更多相关《第十四章多变量数据的统计描述与推断II课件.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十四章多变量数据的统计描述与推断II第1页,此课件共58页哦单变量多变量统计描述均数均数向量方差协方差阵相关系数相关矩阵统计推断单变量t检验Hotelling T2检验单变量方差分析多变量方差分析单变量与多变量之间的比较单变量与多变量之间的比较多变量数据的统计描述和统计推断在描述与表达多变量数据的统计描述和统计推断在描述与表达时采用了多变量的向量和矩阵的表示方法。时采用了多变量的向量和矩阵的表示方法。第2页,此课件共58页哦三 多组比较1 多变量方差分析 通过g个均数向量 推断 是否成立。其备择假设H1:g个组中至少有两个均向量不相等。第3页,此课件共58页哦 方差分析单变量分析 第4页,此
2、课件共58页哦两两比较:LSDSNK第5页,此课件共58页哦描述固定与随机效应方差齐性检验B-F检验检验Welch检验检验第6页,此课件共58页哦第7页,此课件共58页哦第8页,此课件共58页哦正态性、方差不齐时对应的统计分析方法资料转换资料转换秩和检验秩和检验稳健估计稳健估计Welch(F)Brown-Forsythe第9页,此课件共58页哦多变量方差分析的主要思想:将实验结果的总离差平方和SSSS总分解为SSSS组间和SSSS组内两部分,其中SS总,SS组间和SS组内矩阵表示。求得 Wilks Lambda统计量 计算F值,作出统计推断。第10页,此课件共58页哦例14-4 将患慢性胃炎的
3、儿童随机分为3组,其中I组、II组为治疗组,另一组为对照组。试比较治疗药T细胞免疫功能(外周血T3,T4,T8细胞百分比)的影响。表14-5是其中部分儿童的T细胞免疫功能的测量结果。试比较三组慢性胃炎儿童T细胞免疫功能是否存在差异?第11页,此课件共58页哦编号治疗I组编号治疗II组编号对照组T3T4T8T3T4T8T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.0
4、32.036.4572.836.733.1表14-5 三组慢性胃炎儿童的T细胞免疫攻能(%)第12页,此课件共58页哦1 作出检验假设,确定检验水准 ,即三组药物对T细胞免疫功能的影响是相等的。H1:三个均向量不都相等。第13页,此课件共58页哦表14-4 多变量方差分析表变异来源自由度离均差平和矩阵总变异H+E组 间g-1组 内2 计算统计量*及FH-group SSCP EResidual(error)SSCP第14页,此课件共58页哦计算均数:第15页,此课件共58页哦求得组间离均差平方和矩阵H:第16页,此课件共58页哦计算组内离均差平方和计算总离均差平方和矩阵第17页,此课件共58页
5、哦变异来源自由度离均差平方和矩阵总变质11组 间2组 内9表14-6 多变量方差分析表第18页,此课件共58页哦计算统计量*第19页,此课件共58页哦表14-7 常见情况下 与F值的关系反应变量数组数转换关系F分布自由度m=1g2M=2g2m1G=2m1G=3第20页,此课件共58页哦 由表14-7可知,两组均数向量作假设检验时,除Hotelling T2外,还可用多变量方差分析。m=3,g=3,代入表14-7的第四个公式得:第21页,此课件共58页哦3 确定P值,作出结论 查F值表,拒绝H0,接受H1.认为三个组慢性胃炎儿童T细胞免疫功能有差别。从三组的均数向量可看出,两个治疗组的T细胞免疫
6、功能均比对照组低。第22页,此课件共58页哦SPSS操作第23页,此课件共58页哦data ex14_5;if _n_4 then c=1;else if _n_FWilksLambda0.088735385.506140.0041PillaisTrace1.049164542.946160.0394Hotelling-LawleyTrace8.715404369.7767.78950.0028RoysGreatestRoot8.5332872122.76380.0003第25页,此课件共58页哦四 多变量与单变量分析 多变量与对m个反应变量进行一次假设检验,对组间的差别作出推论。在大多数情况
7、下,多变量假设检验结论与m次单变量假设检验的结论是一致的。即多变量假设检验拒绝H0,m次单变量假设检验至少有一次拒绝H0。第26页,此课件共58页哦 (1)假定有k个样本均数向量,对每两个样本均数向量间的差别都作F检验,可作k!/2!(k-2)!次比较,每个样本均数向量都重复比较了k-1次,如果仍以 为临界值,其型错误的概率会远远超过0.05。理论上,单变量假设检验不能代替多变量假设检验第27页,此课件共58页哦 若有3个样本均数向量的比较,共作3次F检验,若每次比较的检验水准=0.05,则每次不犯第一类错误的概率为(1-0.05)=0.95,则正确接受全部3次无效假设的概率为0.953=0.
8、857,这时犯第一类错误的概率为 1-0.857=0.143。因此,两两比较时,不宜用前面所述的F检验。第28页,此课件共58页哦(2)单变量假设检验只能说明某一变量在数轴分布上的组间差别,不能反应多个变量在平面或空间上的差别,两者的意义不同。第29页,此课件共58页哦表14-8 两组新生儿出生时的体重与身长数据编号A组编号B组体重(Kg)身长(Cm)体重(Kg)身长(Cm)13.104614.106023.205023.504833.506233.355043.004643.354953.856753.204863.154863.555073.004673.506083.505583.605
9、6均数3.2952.503.5252.63方差0.308.110.275.21P(t检验)1.62(0.13)0.04(0.97)Hotelling T2 T2=9.87,F=4.58,P=0.03第30页,此课件共58页哦第31页,此课件共58页哦第三节 重复测量资料的多变量分析 Ch12介绍了重复测量资料的单变量ANOVA分析方法。若数据服从“球对称”(spherical symmetrical problem)时,就是通常的随机区组ANOVA。若不服从“球对称”时,须校正自由度。多变量分析的优点:不须考虑数据的“球对称”,直接利用Hotelling T2检验。第32页,此课件共58页哦编
10、号服药前体重值服药前后四周体重值第1周第2周第3周第4周1131.5128.4127.4125.3124.92154.7152.9150.7148.2145.93146.7145.5143.6140.5139.84163.2161.6158.4154.2153.45128.6125.3124.1122.8120.96134.2132.6130.4129.4124.87126.8125.7123.9123.5121.68119.5118.1115.6114.3112.19112.4108.6104.7102.6101.410121.3120.1118.5116.9114.2133.9131.91
11、29.7127.8125.9S 16.2 16.6 16.6 15.9 16.1表12-1 高血压患者治疗前后的舒张压(mmHg)第33页,此课件共58页哦1 建立检验假设 C为初始时间为基线的重复测量对比矩阵(Repeated constrasts)第34页,此课件共58页哦2 计算Hotelling T2 与F统计量第35页,此课件共58页哦本例中n=10,m=5。第36页,此课件共58页哦3 确定P值,作出检验结论查表3.1得拒绝H0,接受H1,即认为服药后1-4周的体重比服药前有所降低。第37页,此课件共58页哦图14-2 10名肥胖患者服药前后体重的变化趋势分析服药后1-4周的体重降
12、低的变化趋势第38页,此课件共58页哦 将10名患者组内变异SS组内(v=4)分解为多项式的1次项、2次项、3次项、4次项,描述体重随时间变化的曲线趋势。第39页,此课件共58页哦SPSS操作第40页,此课件共58页哦第41页,此课件共58页哦结果第42页,此课件共58页哦第四节 轮廓分析 轮廓(profile)分析是比较两组或多组多变量均数向量的轮廓是否相等。轮廓是指各组均数所连成的折线。轮廓分析通常进行组间轮廓相似性或平行性(parallel)、组间平均水平差异显著性和组内条件(如时间或各反应变量间)变异显著性三个方面的假设检验。第43页,此课件共58页哦图14-3 不同麻醉诱导时相的平均
13、收缩压第44页,此课件共58页哦分析思路:如果组间轮廓相似轮廓相似,可进一步分析其他的变异,即了解组间轮廓是否完全一致(即重合)以及各组的轮廓图是否与水平轴(表示组内因素水平间差异,如时间上的差别)平行,因此,轮廓分析首先进行的是轮廓相似性检。第45页,此课件共58页哦例14-7 分别对50名硕士生和30名博士生进行健康状况抽样调查。调查问题设计如下7个问题:对自已健康状况的满意程序(X1)是否需要调养身体(X2)身体胡不适或不舒服的感觉(X3)有生病的感觉(X4)有紧张情绪和压力感(X5)晚间休息感到不能很快入睡(X6)吃饭有时觉得胃口不好(X7)第46页,此课件共58页哦图14-4 调查问
14、卷7个问题的平均得分第47页,此课件共58页哦表 14-10 两组研究生健康问卷的平均得分问题1问题2问题3问题4问题5问题6问题7硕士生均数2.022.322.181.982.442.062.16n=50S0.430.710.480.510.840.840.84博士生均数2.032.302.271.902.271.902.13n=30S0.490.650.520.550.910.760.86合计均数2.032.312.211.952.382.002.15n=80S0.450.690.500.530.860.810.84第48页,此课件共58页哦1 平行检验轮廓对比矩阵(parallel co
15、ntrasts)第49页,此课件共58页哦计算统计量Hotelling T2与F统计量第50页,此课件共58页哦研究P值,作出统计推断不能认为两个总体的轮廓相互平行。第51页,此课件共58页哦2 相合检验(coincident)目的:检验两个总体的轮廓是否重合。如果两个总体的轮廓相互平行,且 时两个总体的轮廓重合。第52页,此课件共58页哦检验假设:统计量 结论:尚不能拒绝H0,可认不两个总体的轮廓重合第53页,此课件共58页哦3 水平轮廓检验 检验两个总体的轮廓是否为水平直线平行。若两个总体的轮廓相等,则多变量数据的各变量的均数是相等的。在两组数据重合的情况下,可视为一个总体,合并后的总体均
16、数为 若有则为直线轮廓。第54页,此课件共58页哦2 计算统计量3 确定P值,作出结论 拒绝H0,即认为合并后总体的轮廓不是一条水平线。即7个问题的得分有高有低,其中第5个问题(有紧张情绪和压力感)的平均得分最高,第4个问题(有生病的感觉)平均分最低。第55页,此课件共58页哦注意点:1 轮廓分析是一种的多元分析方法,用来检验组间平均水平趋势的一致性,当组间轮廓相似(平行)时,它比一般组间均值向量相等的假设检验更为有力。重复观测轮廓分析可以检验组间轮廓相似性、重合性以及与水平轴的平行性。第56页,此课件共58页哦2 轮廓分析的组间轮廓相似性检验等价于多元方差分析(MANOVA)的组间因素与组内因素(如重复因素)间交互作用效应检验,即若轮廓相似,则处理因素与组内因素(重复因素)间不存在交互作用。第57页,此课件共58页哦3 轮廓相似,可以进一步分析了解组间轮廓是否一致以及是否与水平轴平行,前者考虑的是组间因素水平(处理)的差异情况,后者注重的是组内因素(反应变量,重复因素)各条件间差异情况。相反,若轮廓相似,则处理因素与反应变量(重复因素)存在交互作用,此时,不必作进一步分析。第58页,此课件共58页哦