《一般线性模型.pptx》由会员分享,可在线阅读,更多相关《一般线性模型.pptx(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、方差分析中的术语1.因素与处理(Factor):因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件;也可通称为因素;用分类变量表示,取有限的离散值;2.水平(Level):因素的不同等级称作水平。水平值取有限的离散值。如:性别因素有两个水平0,1(男、女)等3.单元(Cell):指各因素的水平之间的每个组合。如性别(0,1)和年龄(10,11,12)的六种组合。1第1页/共55页方差分析中的术语(续)4.因素的主效应和因素间的交互效应 (如药物A、B的主效应及AB的交互效应)5.均值比较:n均值的相对比较是比较各因素对因变量的效应大小的相对比较,如研究A、B的单独效应之和是否等于它
2、们的交互效应,或A、B的效应是否相等。n均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异。如A、B的疗效是否存在显著性差异。6.单元均值、边际均值:n在多因素方差分析中,每种因素水平组合的因变量均值称为单元均值。一个因素水平的因变量均值称为边际均值(Marginal Means)2第2页/共55页方差分析中的术语(续)7、协方差分析:在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究不同处理对研究对象的影响就是这个道理。如研究身高与体重的关系时要求按性别分别进行分析,以消除性别因素的影响。要消除其他因素的影响,应
3、采用协方差分析。8、重复测量:组内变异的主要的原因是实验对象之间的个体差异。由于个体差异存在,即使实验对象受到相同的处理,他们的因变量值也可能相当不同。重复测量设计的方差分析也是像协方差分析一样,是在研究中减少个体差异带来的误差方差的一种有效方法,而且由于对相同个体进行重复测量,在一定程度上降低了人力、物力、财力的消耗。如果重复测量是在一段时间内或一个温度间隔内进行的,还可以研究因变量对时间、温度等自变量的变化趋势,这种重复测量研究称为趋势研究。3第3页/共55页方差分析过程1、One-Way过程:单因素简单方差分析过程。在Compare Means菜单项中,可以进行单因素方差分析、均值多重比
4、较和相对比较。2、General Linear Model(简称GLM)过程:GLM过程由Analyze菜单直接调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。4第4页/共55页一般线性模型General Linear Model菜单第5页/共55页一般线性模型单应变量的检验多应变量的检验重复测量数据的检验方差分量分析6第6页/共55页UnivariateUnivariate子菜单:子菜单:提供回归分析和一个因变量和一个或几个因素变量的方差分析。MultivariateMultivariate子菜单:子菜单:可进行多因变量的多因
5、素分析Repeted MeasuresRepeted Measures子菜单:子菜单:可进行重复测量方差分析Variance ComponentsVariance Components子菜单:子菜单:可进行方差成分分析。通过计算方差估计值,可以帮助我们分析如何减小方差。7第7页/共55页成组设计的方差分析(即单因素方差分析)配伍设计的方差分析(即两因素方差分析)交叉设计的方差分析析因设计的方差分析重复测量的方差分析协方差分析等 8第8页/共55页某湖水不同季节氯化物含量测定值如,分析不同季节氯化物含量有无差别?9第9页/共55页方法方法1:compare means one way ANOVA
6、10第10页/共55页一般线性模型11第11页/共55页12第12页/共55页13第13页/共55页例 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?问题1:影响增重的因素有几个?问题2:要设几个变量?14第14页/共55页15第15页/共55页应变量固定因素随机因素协变量限选1个变量,且为数值变量分组变量,可选1个或多个加权变量16第16页/共
7、55页用于设置在模型中包含哪些主效应和交互因子,默认情况为Full factorial,即分析所有的主效应和交互作用 定义模型全因素模型自定义模型17第17页/共55页进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析 方差分析模型类别 是否在模型中包括截距 因素及其类型(F)固定因素(R)随机因素(C)协变量模型方式18第18页/共55页19第19页/共55页【Contrast钮】弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,使用频率少;【Plots钮】用于指定用模型的某些参数作图,比如用food和group来作图,用的也比较少(指国内
8、,因为它主要是用来做模型诊断用的)。【Post Hoc钮】该按钮弹出的两两比较对话框。本题对food作两两比较,方法为SNK法。【Save钮】将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,如预测值、残差、诊断用指标等。【Options钮】定义选项,可以定义输出哪些指标的估计均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。20第20页/共55页首先是所用方差分析模型的检验,F值为11.517,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量GROUP,
9、可见它也有统计学意义,不过我们关心的也不是他;第四行是真正要分析的FOOD,P值为0.084,没有统计学意义。结论是:尚不能认为三种营养素喂养的小白鼠体重增量有差别。21第21页/共55页随机区组设计的方差分析例9-2为研究不同卡坏对牙齿的固定效果,以10颗取自新鲜尸体的牙齿为实验对象。每颗牙齿同时随机在不同部位固定三种卡环,测试抗拉强度,分析3中卡环的固定效果有无差异?22第22页/共55页Group变量Teeth区组变量Pull因变量两因素23第23页/共55页24第24页/共55页25第25页/共55页26第26页/共55页27第27页/共55页不能用fullfactorial两因素间不
10、存在交互作用28第28页/共55页29第29页/共55页30第30页/共55页31第31页/共55页对于初学者来说可能有用的几个问题对于初学者来说可能有用的几个问题 需要分析的影响因素可以都选入fixed factor框,如果不是复杂的模型,一般分析结果不会有误。方差分析模型多数情况下要选model III,但这在数据存在缺失值、设计不平衡等情况下要慎重考虑,因为此时往往会要求模型进行详细的设置。model的设置对分析是非常重要的,如果设置不正确,可能什么都做不出来,比如无重复数据的方差分析纳入了交互作用、析因设计的方差分析纳入了设计中不存在的因素,就会做不出结果。一般线性模型的复杂性是超出大
11、家想象的,一但有存在疑问的内容,一定要查阅有关统计书籍32第32页/共55页重复测量资料数据形式(表重复测量资料数据形式(表12-3 12-3)受试者受试者 编编 号号 放置时间(分)放置时间(分)0459013515.325.324.984.6525.325.264.934.7035.945.885.435.0445.495.435.325.0455.715.495.434.9366.276.275.665.2675.885.775.434.9385.325.155.044.48 g1 m4 n8单组重复测量资料单组重复测量资料33第33页/共55页重复测量设计重复测量设计方法:重复测量的方
12、差分析方法:重复测量的方差分析目的:推断处理、时间、处理目的:推断处理、时间、处理时间对时间对试验对象的试验指标的作用试验对象的试验指标的作用资料:资料:处理因素分处理因素分g g个水平,每组随机分配个水平,每组随机分配n n个试验个试验对象,共对象,共ngng个,个,g g11时间因素分时间因素分m m个水平(个水平(m m个时点),每个对象个时点),每个对象有有m m个时点上的测量值,共个时点上的测量值,共gnmgnm个,个,m2m2特例:特例:g g1 1,单组重复测量资料,单组重复测量资料 m m2 2,前后重复测量资料,前后重复测量资料34第34页/共55页实验操作方法实验操作方法重
13、复测量数据的两因素多水平设计,两因素重复测量数据的两因素多水平设计,两因素包括一个干预因素(包括一个干预因素(A A因素)和测量时间因素因素)和测量时间因素(B B因素);因素);多水平指干预(多水平指干预(A A因素)有因素)有g g(22)个水平,)个水平,测量时间(测量时间(B B因素)有因素)有mm(22)个水平(测)个水平(测量时间点)。量时间点)。随机化分组采用完全随机设计的分组方式,随机化分组采用完全随机设计的分组方式,将将gngn个观察对象随机分配到个观察对象随机分配到g g 个处理组中。个处理组中。数据收集在数据收集在mm个时间点上进行,每一个观察个时间点上进行,每一个观察对
14、象在完全相同的时间点上重复进行对象在完全相同的时间点上重复进行mm次测量。次测量。35第35页/共55页表12-2 高血压患者治疗前后的舒张压(mmHg)顺序号顺序号 处处 理理 组组 顺序号顺序号 对照组对照组治疗前治疗前治疗后治疗后 差值差值 治疗前治疗前 治疗后治疗后 差值差值 1130 11411 118 1242124 11012 132 1223136 12613 134 1324128 11614 114 965122 10215 118 1246118 10016 128 1187116 9817 118 1168138 12218 132 1229126 10819 120
15、12410124 10620 134 128 合合 计计12621102合合 计计1248均均 数数 126.2110.216.0均均 数数 124.81206 4.2标准差标准差 7.08 9.31 3.13 标准差标准差 7.90 120.6 8.02 g2 m2 n1036第36页/共55页表表12-212-2数据的统计学分析问题数据的统计学分析问题计算前后测量数据的差值,上述数据即可转化为完全随机设计(两组)的资料形式。计算前后测量数据的差值,上述数据即可转化为完全随机设计(两组)的资料形式。一般情况下,针对前后测量数据差值的成组一般情况下,针对前后测量数据差值的成组t t检验方法是可
16、取的,但应注意其应用条件,即方差齐性的问题。检验方法是可取的,但应注意其应用条件,即方差齐性的问题。37第37页/共55页对象内对象内MkMk对象间对象间B Bj j g3 m5 n5A Ai iTij38第38页/共55页重复测量设计资料的统计分析方法重复测量设计资料的统计分析方法对于重复测量数据(临床上常称纵向监测数据)对于重复测量数据(临床上常称纵向监测数据),实质上每个受试对象的观察结果是多次重复,实质上每个受试对象的观察结果是多次重复测量结果的连线,统计分析的目的是比较这些测量结果的连线,统计分析的目的是比较这些连线连线变化趋势变化趋势的特征。的特征。重复测量试验数据的方差分析需要考
17、虑两个因重复测量试验数据的方差分析需要考虑两个因素,一是处理分组,二是测量时间。素,一是处理分组,二是测量时间。可采用的统计分析方法:可采用的统计分析方法:1.1.多元方差分析方法多元方差分析方法2.2.重复测量数据的方差分析重复测量数据的方差分析39第39页/共55页变异分解思路变异分解思路重复测量数据的变异由两大部分组成。一是观重复测量数据的变异由两大部分组成。一是观察察对象间对象间差异,二是差异,二是重复测量重复测量间差异。间差异。观察观察对象间对象间差异包括处理组间差异和观察对象差异包括处理组间差异和观察对象个体间变异两部分;重复测量间差异包括测量个体间变异两部分;重复测量间差异包括测
18、量时间之间差异、处理与测量时间的交互作用和时间之间差异、处理与测量时间的交互作用和组内误差三个部分。组内误差三个部分。因此,重复测量数据的总变异可分解为因此,重复测量数据的总变异可分解为处理组、处理组、测量时间、处理组与测量时间的交互作用、观测量时间、处理组与测量时间的交互作用、观察对象间随机误差以及重复测量误差察对象间随机误差以及重复测量误差等五个部等五个部分。分。40第40页/共55页41第41页/共55页42第42页/共55页43第43页/共55页定义重复测量的变量名重复测量的模型,应变量被重复测量了几次,分别存放在几个变量中,所以我们这里要自行定义应变量 定义重复测量次数添加、修改和删
19、除重复测量的变量定义嵌套的重复测量变量44第44页/共55页45第45页/共55页对象内变量对象间变量46第46页/共55页五次重复测量的变量名分组变量情况47第47页/共55页对组内变量以及它和分组变量交互作用的多元方差分析四种多元检验方法48第48页/共55页球形检验结果满足球对称假设需校正时的三种校正系数仅供参考,后面的检验结果已自动进行了校正49第49页/共55页组内因素一元方差分析检验结果球对称假设成立50第50页/共55页各重复测量间变化趋势的分析不满足任何一种直线或曲线趋势51第51页/共55页组间效应的方法分析结果组间比较存在差异52第52页/共55页五次测量的均数图53第53页/共55页结论结论 不同麻醉诱导方法存在组间差别;患者的收缩压在不不同麻醉诱导方法存在组间差别;患者的收缩压在不同的诱导方法下不同诱导时相变化的趋势不同,其中同的诱导方法下不同诱导时相变化的趋势不同,其中A A组不组不同诱导时相收缩压较为稳定。同诱导时相收缩压较为稳定。54第54页/共55页55感谢您的观看。第55页/共55页