《医学统计学方差分析.pptx》由会员分享,可在线阅读,更多相关《医学统计学方差分析.pptx(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计推断随机抽样参数?统计量(、)(x x、s s、p p)参数估计假设检验第1页/共61页第6章均方分析,变异数分析,F 检验(由英国著名统计学家R.A.Fisher推导出来的),是对变异的来源及大小进行分析的一种统计方法。第2页/共61页教学目的与要求掌握:1、方差分析的基本思想2、方差分析前提条件3、多重比较4、重复测量资料方差分析了解:1、两因素方差分析第3页/共61页教学内容提要重点讲解:方差分析的基本思想完全随机设计的单因素方差分析多个样本均数间的多重比较介绍:方差分析的原理与条件第4页/共61页不同的是:方差分析用于多个均数的比较。与前面讲过的假设检验相同的是:方差分析的任务:统
2、计量F的计算 FMS1/MS2t检验是用t值进行假设检验,方差分析则用F值进行假设检验第5页/共61页方差分析的基本概念6方差分析的几个概念和符号什么是方差?离均差离均差之和离均差平方和(SS)方差(2S2)也叫均方(MS)标准差:S自由度:关系:MS=SS/方差分析的基本概念第6页/共61页方差分析的几个符号 xij表示第i组第j个观察值表示第i组的均数(=)表示总平均=第7页/共61页基本思想:先假设(H0)各总体均数全相等;将总变异SS总,按设计和资料分析的需要分为两个或多个组成部分,其自由度也相应地分为几个部分,以随机误差为基础,按F分布的规律作统计推断。目的:推断总体平均数是否相等.
3、独特之处:不直接比较均数,利用变异的关系进行判别.第一节完全随机设计资料的方差分析(单因素方差分析)第8页/共61页一、方差分析的意义前一章介绍了两个样本均数比较的假设检验方法,但对于3个、4个、5个均数或更多个的比较,t检验或u检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验时通常检验水平取0.05,亦即弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,可信度成为(1-0.05)3=0.857第9页/共61页四均数比较作6次(1-0.05)6=0.735五均数比较作10次(1-0.05)10=0.599六均数比较
4、作15次(1-0.05)15=0.463鉴于以上的原因,对多组均数的比较问题我们采用方差分析第10页/共61页例1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87二、单因素方差分析的基本思想第11页/共61页24名患者与健康人的血磷值大小不等,称这种变异为总变异。可以
5、用总离均差平方和 及N来反映,总自由度 T=N-1。SS总第12页/共61页2个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用2组组内离均差平方和及各组例数ni来反映,自由度组内=N-k(k是组数),它反映了随机误差。SS组内第13页/共61页2组样本均数也不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差组间变异(betweengroupsvariation):SS组间v组间k1第14页/共61页三者关系SS总=SS组间+SS组内v总=组间+组内第15页/共61页直观意义检验统计量F统计量具2个自由度:v1,v2第16页/共61页 如果两组样本来自同一总体,即克山病患
6、者与健康人血磷值相同,则理论上F应等于1,因为两种变异都只反映随机误差。由于抽样误差的影响,F值未必是1,但应在1附近。若F较小,我们断定2组均数相同,或者说来自同一总体,F较大,推断不是来自同一总体。第17页/共61页三、优点不受比较的组数限制。可同时分析多个因素的作用。可分析因素间的交互作用。四、方差分析的应用条件各样本是相互独立的随机样本各样本来自正态总体各组总体方差相等,即方差齐第18页/共61页【例题1 1】某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载脂蛋白测定,结果如下,问3种人的载脂蛋白有无差别?问题:1、分析问题,选择合适的统计方法2、如何整理资料、输入计算机第1
7、9页/共61页85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合计xij1160921.512283309.5(x)ni1191030(N)均数105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xij2123509.5296045.35153420372974.87(x2)85.796.0144.0105.2124.5117.0109.5
8、105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合计xij1160921.512283309.5(x)ni1191030(N)均数105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xij2123509.5296045.35153420372974.87(x2)第20页/共61页列举存在的变异及意义全部的30个实验数据之间大小不等,存在变异,总变异。各个组间存在变异:反映处理因素之间的作用,以及随机误差。
9、各个组内个体间数据不同:反映了观察值的随机误差。各种变异的表示方法第21页/共61页各种变异的表示方法SS总 总MS总SS组内组内MS组内SS组间组间MS组间三者之间的关系:SS总=SS组内+SS组间总=组内+组间第22页/共61页统计量F 的计算及其意义F=MS组间/MS组内自由度:组间=组数-1组内=N-组数通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。第23页/共61页各种符号的意义xij第i 个组的第j 个观察值i=1,2,kj=1,2,ni ni第i 个处理组的例数ni=Nxi=x=第24页/共61页(x)2第25页/共61页(1)建立假设和确定
10、检验水准H0:三种人载脂蛋白的总体均数相等,1=2=3H1:三组总体均数不相等或不全等=0.05(2)计算C=(x)2/N=(3309.5)2/30=365093SS总=x2-C=372974.87-365093=7881.87第26页/共61页SS组内=SS总-SS组间=7881.87-2384.026=5497.84总=N-1=29,组 间=k-1=2,组 内=N-k=30-3=27 MS组间=SS组间/组间=1192.01 MS组内=SSE/组内=203.62F=MS组间/MS组内=5.8540第27页/共61页(3)查 方 差 分 析 F界 值 表 8确 定 P值:F 0.05(2,3
11、0)=3.32;F 0.01(2,30)=5.39(4)作出推断结论按=0.05水平拒绝H0,接受H1,认为三种人载脂蛋白的总体均数不同。组间组内第28页/共61页完整书写方差分析的过程建立假设,确定显著性水平:H0:3种载脂蛋白的总体均数相等 1=2=3H1:3种载脂蛋白的总体均数不相等或不全相等H1与H0相反,如果H0被否决,则H1成立。常取0.05,区分大小概率事件的标准。计算统计量F:根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。计算概率值P:P的含义。做出推论:统计学结论和专业结论。第29页/共61页四组不同摄入方式人的血浆游离吗啡水平静脉点滴静脉点滴肌肉注射
12、肌肉注射皮下注射皮下注射口服口服1212 9121016 7 8 715 6 8 8 9 1110 9 714均数均数1013 8 9.5单因素方差分析第30页/共61页完整书写方差分析的过程建立假设:H0:4组病人血浆游离吗啡水平 1=2=3=4H1:4组病人血浆游离吗啡水平的总体均数全不相等或不全相等确定显著性水平,用 表示。区分大小概率事件的标准,常取0.05。计算统计量F:F=MS组间/MS组内根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。计算概率值P:P的含义。做出推论:统计学结论和专业结论。单因素方差分析第31页/共61页方差分析表(练习,完成该表。例题,写
13、在黑板上)单因素方差分析F0.05(3,15)3.29F与它所对应的P值成反比第32页/共61页结合上题理解:方差分析的基本思想将全部观察值总的离均差平方和(SS总)及自由度(总)分解为两个或多个部分除随机误差外,其余每个部分的变异可由某个因素的作用加以解释通过比较不同来源变异的均方(MS),借助F分布做出统计推断,从而了解该因素对观察指标有无影响。第33页/共61页存在问题方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。第34页/共61页第二节多个样本均数间的两
14、两比较(又称多重比较)多重比较即多个样本均数间的两两比较,由于涉及的对比组数大于2,若仍用t 检验作每两个对比组比较的结论,会使犯第一类错误的概率增大,即可能把本来无差别的两个总体均数判为有差别。4个样本均数间的比较第35页/共61页多重比较方法(两两比较)对满足正态性和方差齐性的资料:多个实验组分别与一个对照组比较常用Dunnet-t法。每两个均数比较常用最小显著差值法(LSD-t)、SNK(Student-Newman-Keuls,即q检验)法、Tukey(可靠显著差异)法、Bonferroni-t(校正最小显著差异)调整法等。对不满足正态性和方差齐性的资料:可通过数据变换,使满足方差分析
15、的应用条件。可用非参数检验法,如秩和检验。可采用近似检验,如Tamhanes T2,Dunnetts T3,Games-Howell,Dunnetts C等方法。第36页/共61页检验统计量q检验界值表见附表10,它有两个自由度,一个是m(k),m指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身);另一个是=e。误差一、q检验(又称Student-Newman-Keuls法,简称SNK-q检验法)常用于多个样本均数间每两个均数的比较。第37页/共61页例(续例3)对三个人群的载脂蛋白作两两比较。(1)建立假设,确定检验水准H0:任 2个 人 群
16、 的 载 脂 蛋 白 的 总 体 均 数 相 等,即A=BH1:AB,=0.05。(2)样本均数排序将3组样本均数从小到大(或从大到小)顺序排列,编上组次,并注上组别.组次123均数102.39105.45122.80组别IGT异常糖尿病患者正常人第38页/共61页(3)列出两两均数比较的q检验计算表从p值一栏中可以推断出结论,即IGT异常(1)与正常人(3)的载脂蛋白有差别,糖尿病患者(2)与正常人(3)的载脂蛋白有差别。第39页/共61页二、LSD-t 检验 由Fisher提出,称为最小显著性差异法。在H0:ij假设下,t统计量检验i与j是否相同。,(dfdfe)(6-9)可查统计附表7确
17、定概率P的大小。常用于多个样本均数间每两个均数的比较。第40页/共61页三、Dunnett-t检验 常用于多个实验组与一个对照组均数间的两两比较。实验组对照组可查统计附表9确定概率P的大小。第41页/共61页四、Bonferroni-t检验Bonferron t=(6-12)假设比较次数为m,则=b/m作为每次比较的水平。调整检验水准法第42页/共61页例题对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表,问3种不同营养素喂养后所增体重有无差别
18、?第43页/共61页第44页/共61页方法:应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近目的:减少了个体间差异对结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。是配对资料的扩充。双因素方差分析第三节随机区组(配伍组)设计的多个样本均数的比较(双因素方差分析)第45页/共61页例题对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表,问3种不同营养素喂养后所增体
19、重有无差别?第46页/共61页第47页/共61页分析变异总变异组间变异误差(组内)变异配伍间变异第48页/共61页SS总 总SS误差误差MS误差SS组间组间MS组间变异之间的关系:SS总=SS误差+SS组间+SS区间总=误差+组间+区间变异间的关系SS区间区间MS区间第49页/共61页统计量F的计算F1=MS组间/MS误差F2=MS区间/MS误差自由度:组间=组数-1=3-1=2区间=区数-1=8-1=7误差=总-组间-区间=23-7-2=14第50页/共61页第51页/共61页第52页/共61页第53页/共61页第54页/共61页第55页/共61页完整书写方差分析的过程建立假设,确定显著性水
20、平:H0:3种营养素喂养的小白鼠体重增量相等 1=2=3H1:3种营养素喂养的小白鼠体重增量不全相等 常取0.05,区分大小概率事件的标准。计算统计量F:F1=MS组间/MS误差计算概率值P:P的含义。做出推论:统计学结论和专业结论。第56页/共61页完整书写方差分析的过程建立假设,确定显著性水平:H0:8窝小白鼠体重增量相等 1=2=3H1:8窝小白鼠体重增量不相等或不全相等 常取0.05,区分大小概率事件的标准。计算统计量F:F2=MS区间/MS误差计算概率值P:P的含义。做出推论:统计学结论和专业结论。第57页/共61页课堂测验(一)1.研究人员在某县随机抽取了225名女婴,测量其出生体重,均数为3.20kg,标准差为0.44kg,请计算:该县女婴出生体重95参考值范围该县女婴出生体重总体均数的95可信区间第58页/共61页2.某研究人员从某地随机抽取了部分健康成人,并对其进行血红蛋白含量的测定,结果如下表:问该地健康成人男、女间血红蛋白含量有无差别?性别例数均数(g/L)标准误(g/L)男25134.51.2女16117.61.3第59页/共61页3.为研究A、B、C三种治疗缺铁性贫血的药物的疗效,某研究者将11例患者完全随机地分为三组,分别给予三种药物,治疗一个疗程后的结果如表5.3,请作统计分析。第60页/共61页感谢您的观看!第61页/共61页