第9讲协方差分析与混合线性模型.ppt

上传人:石*** 文档编号:49407862 上传时间:2022-10-08 格式:PPT 页数:35 大小:2.53MB
返回 下载 相关 举报
第9讲协方差分析与混合线性模型.ppt_第1页
第1页 / 共35页
第9讲协方差分析与混合线性模型.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《第9讲协方差分析与混合线性模型.ppt》由会员分享,可在线阅读,更多相关《第9讲协方差分析与混合线性模型.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第9讲协方差分析与混合线讲协方差分析与混合线性模型性模型现在学习的是第1页,共35页 如果在单因素、双因素或多因素试验中如果在单因素、双因素或多因素试验中有无法控制的因素有无法控制的因素x x影响试验的结果影响试验的结果Y Y,且,且x x可以测量、可以测量、x x与与Y Y之间又有显著的线性回归之间又有显著的线性回归时,常常利用线性回归来矫正时,常常利用线性回归来矫正Y Y的观测值、的观测值、消去消去x x的差异对的差异对Y Y的影响。的影响。例如,研究施肥对苹果树产量的影响,例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对由于苹果树的长势不齐,必须消去长势对产量的影

2、响。又如,研究饲料对动物增重产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去的影响,由于动物的初重不同,必须消去初重对增重的影响。初重对增重的影响。协方差分析协方差分析现在学习的是第2页,共35页 这种不是在试验中控制某个因素,而这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法

3、,称为协方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重素,例如苹果树的长势,又如动物的初重等等称为协变量。等等称为协变量。1 协方差分析思想原理协方差分析思想原理现在学习的是第3页,共35页2 单因素协方差分析单因素协方差分析-理论理论现在学习的是第4页,共35页2 单因素协方差分析单因素协方差分析-理论理论现在学习的是第5页,共35页2 单因素协方差分析单因素协方差分析-理论理论现在学习的是第6页,共35页2 单因素协方差分析单因素协方差分析-理论理论现在学习的是第7页,共35页2 单因素协方

4、差分析单因素协方差分析-计算计算现在学习的是第8页,共35页data ex;do a=ex;do a=1 to to 3;do i=;do i=1 to to 8;input x y ;output;end;end;input x y ;output;end;end;cards;cards;47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 52 54 53 5

5、3 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 6644 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66;proc glm;class a;model y=x a/solution;class a;model y=x a/solution;lsmeans a/stderr pdiff;lsmeans a/stderr pdiff;run;2 单因素协方差分析单因素协方差分析-计算计算现在学习的是第9页,共35页2 单因素协方差分析单因素

6、协方差分析-计算计算现在学习的是第10页,共35页 施用三种肥料的产量矫正后有极显著的施用三种肥料的产量矫正后有极显著的差异差异 2 单因素协方差分析单因素协方差分析-计算计算现在学习的是第11页,共35页3双因素协方差分析双因素协方差分析-不考虑交互作用不考虑交互作用 方差来源平方和自由度 均方和 F值 显著性 A QA r-1 MQA FA B QB s-1 MQB FB 误差 QErs-r-s MQE 总和 QT rs-2现在学习的是第12页,共35页3双因素协方差分析双因素协方差分析-不考虑交互作用不考虑交互作用现在学习的是第13页,共35页 data ex;do a=1 to 3;d

7、o b=1 to 5;data ex;do a=1 to 3;do b=1 to 5;input x y ;output;end;end;input x y ;output;end;end;cards;cards;8 2.85 10 4.24 12 3.00 11 4.94 10 2.888 2.85 10 4.24 12 3.00 11 4.94 10 2.8810 3.14 12 4.50 7 2.75 12 5.84 10 4.0610 3.14 12 4.50 7 2.75 12 5.84 10 4.0612 3.88 10 3.86 9 2.82 10 4.94 9 2.8912 3

8、.88 10 3.86 9 2.82 10 4.94 9 2.89;proc glm;class a b;model y=x a b/solution;proc glm;class a b;model y=x a b/solution;lsmeans a b/stderr pdiff;run;lsmeans a b/stderr pdiff;run;3双因素协方差分析双因素协方差分析-不考虑交互作用不考虑交互作用现在学习的是第14页,共35页3双因素协方差分析双因素协方差分析-不考虑交互作用不考虑交互作用现在学习的是第15页,共35页 方差来源平方和 自由度 均方和 F值 显著性 A0.604

9、6 2 0.3023 2.49 N B7.1245 4 1.7811 14.66 *误差0.8502 7 0.1215 总和8.5793 1各小区的产量矫正后没有显著的差异,各品种各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。的产量矫正后有极显著的差异。3双因素协方差分析双因素协方差分析-不考虑交互作用不考虑交互作用现在学习的是第16页,共35页 方差来源 平方和自由度 均方和 F值 显著性 A QA r-1 MQA FA B QB s-1 MQB FB AB QAB(r-1)(s-1)MQAB FAB 误差 QErs(m-1)-1 MQE 总和 QT rsm-24双因素

10、协方差分析双因素协方差分析-考虑交互作用考虑交互作用现在学习的是第17页,共35页4双因素协方差分析双因素协方差分析-考虑交互作用考虑交互作用现在学习的是第18页,共35页data ex;do a=1 to 4;do b=1 to 2;data ex;do a=1 to 4;do b=1 to 2;do i=1 to 2;input x y;output;end;end;end;do i=1 to 2;input x y;output;end;end;end;cards;cards;14.6 97.8 12.1 94.2 19.5 11.2 18.814.6 97.8 12.1 94.2 19

11、.5 11.2 18.8110.1 1.6 100.3 12.9 98.5 18.5 119.4 110.1 1.6 100.3 12.9 98.5 18.5 119.4 12.2 114.7 12.8 99.2 10.7 89.612.2 114.7 12.8 99.2 10.7 89.612.212.2122.2 16.9 105.3 12.0 102.1 12.4 103.8 122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.916.4 117.2 17.2 117.9proc glm;class a b;model y

12、=x a bproc glm;class a b;model y=x a ba*b/solution;lsmeans a b/stderr pdiff;a*b/solution;lsmeans a b/stderr pdiff;run;run;4双因素协方差分析双因素协方差分析-考虑交互作用考虑交互作用现在学习的是第19页,共35页4双因素协方差分析双因素协方差分析-考虑交互作用考虑交互作用现在学习的是第20页,共35页 方差来源 平方和自由度 均方和 F值显著性 A277.43485 392.4782866.51 *B 2.845259 3 2.845259 0.20 N AB 12.848

13、100 1 4.282700 0.30 N 误差 99.441171 714.205882 A与与B的交互作用矫正后不显著,促生长剂的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著之间的差异极显著,试验批次间的差异不显著 4双因素协方差分析双因素协方差分析-考虑交互作用考虑交互作用现在学习的是第21页,共35页3.混合线性模型混合线性模型通过一个例子讲述混合线性模型的使用通过一个例子讲述混合线性模型的使用艾滋病疗法的评价艾滋病疗法的评价艾滋病是当前人类社会最严重的瘟疫之一,从艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的年发现以来的20多年间,它已经吞噬了

14、近多年间,它已经吞噬了近3000万人的生命。万人的生命。艾滋病的医学全名为艾滋病的医学全名为“获得性免疫缺损综合症获得性免疫缺损综合症”,英文简称,英文简称AIDS,它,它是由艾滋病毒(医学全名为是由艾滋病毒(医学全名为“人体免疫缺损病毒人体免疫缺损病毒”,英文简称英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御细胞在抵御HIV的入侵中起着重要作用,当的入侵中起着重要作用,当CD4被被HIV感染而裂解时,其数量

15、感染而裂解时,其数量会急剧减少,会急剧减少,HIV将迅速增加,导致将迅速增加,导致AIDS发作。发作。现在学习的是第22页,共35页3.混合线性模型混合线性模型艾滋病治疗的目的,是尽量减少人体内艾滋病治疗的目的,是尽量减少人体内HIV的的数量,同时产生更多的数量,同时产生更多的CD4,至少要有效地降,至少要有效地降低低CD4减少的速度,以提高人体免疫能力。减少的速度,以提高人体免疫能力。迄今为止人类还没有找到能根治迄今为止人类还没有找到能根治AIDS的疗法,的疗法,目前的一些目前的一些AIDS疗法不仅对人体有副作用,疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积而且成本也很高

16、。许多国家和医疗组织都在积极试验、寻找更好的极试验、寻找更好的AIDS疗法。疗法。现在学习的是第23页,共35页3.混合线性模型混合线性模型请你完成以下问题:请你完成以下问题:(1)利用附件)利用附件1的数据,预测继续治疗的效果,或者确定最的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件利用附件2的数据,评价的数据,评价4种疗法的优劣(仅以种疗法的优劣(仅以CD4为标准)为标准),并对较优的疗法预

17、测继续治疗的效果,或者确定最佳治疗终止时间。并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,美元,400mg didanosine 0.85美元,美元,2.25 mg zalcitabine 1.85美元,美元,400 mg nevirapine 1.20美元。美元。如果病人需要考虑如果病人需要考虑4种疗法的费用,对(种疗法的费用,对(2)中的评价和预测(或)中的评价和预测(或者提前终止)有什么改变。者提前终止)有什么改变

18、。现在学习的是第24页,共35页3.混合线性模型混合线性模型ID 疗法疗法 年龄年龄 时间时间 Log(CD4 count+1)1236.427103.1355 1236.42717.57143.0445 1236.427115.57142.7726 1236.427123.57142.8332 1236.427132.57143.2189 1236.4271403.0445 2447.846703.0681 2447.846783.8918 2447.8467163.9703 2447.8467233.6109 2447.846730.71433.3322 2447.8467393.0910

19、 3160.287503.7377 4336.596904.1190 4336.59697.14294.1109 4336.596916.14294.7095 现在学习的是第25页,共35页3.混合线性模型混合线性模型1对对4种疗法的疗效评价的分析种疗法的疗效评价的分析对题目所给的附件对题目所给的附件2的数据进行分析可知,决定病人的的数据进行分析可知,决定病人的CD4的浓度的因素有年龄,检查的时刻,治疗方案这三个因的浓度的因素有年龄,检查的时刻,治疗方案这三个因素。因此我们将年龄分成素。因此我们将年龄分成5类,检查的时刻分为类,检查的时刻分为4个时间个时间段,治疗方案有段,治疗方案有4种。而问

20、题是以种。而问题是以CD4的浓度为标准来评的浓度为标准来评价疗效的优劣,即价疗效的优劣,即CD4的浓度越大,那么疗效越好。由于的浓度越大,那么疗效越好。由于考虑题中所给的样本有考虑题中所给的样本有6000多个(病人的个数多个(病人的个数*各个病人检各个病人检查的次数),因此我们考虑用查的次数),因此我们考虑用MIXED(混合线性模型)。(混合线性模型)。下面我们就混合线性模型的原理进行说明。下面我们就混合线性模型的原理进行说明。现在学习的是第26页,共35页3.混合线性模型混合线性模型混合线性模型过程是拟合许多不同数据的混合线性模型,混合线性模型过程是拟合许多不同数据的混合线性模型,并利用所拟

21、合的模型对数据进行统计推断。并利用所拟合的模型对数据进行统计推断。首先混合线性模型的主要假设是数据服从正态分布,由于首先混合线性模型的主要假设是数据服从正态分布,由于本题所给的数据的样本容量有本题所给的数据的样本容量有6000多个,因此,我们可认多个,因此,我们可认为它服从正态分布。又由于正态分布的数据可完全有均值和为它服从正态分布。又由于正态分布的数据可完全有均值和方差确定,因此一个混合线性模型是由两个模型决定的。分方差确定,因此一个混合线性模型是由两个模型决定的。分别是均值模型和方差模型。别是均值模型和方差模型。MIXED使用约束最大似然的方使用约束最大似然的方法来拟合数据的。一旦数据的模

22、型已经建立,我们可以法来拟合数据的。一旦数据的模型已经建立,我们可以使用该模型通过固定效应参数和协方差参数进行统计推使用该模型通过固定效应参数和协方差参数进行统计推断。用这些统计量可以对模型进行评价。断。用这些统计量可以对模型进行评价。现在学习的是第27页,共35页3.混合线性模型混合线性模型再者,该分析的重要假设是数据是正态分布的,由于我再者,该分析的重要假设是数据是正态分布的,由于我们将附录们将附录2的数据进行了分类。由于数据出现在类(如的数据进行了分类。由于数据出现在类(如可能是同一年龄段中),那可能的情况是来自同一年可能是同一年龄段中),那可能的情况是来自同一年龄段的这些龄段的这些CD

23、4的值是相关的,不是独立的。鉴于此,的值是相关的,不是独立的。鉴于此,由于附录由于附录2所给的数据是高度数据(即样本容量很大),所给的数据是高度数据(即样本容量很大),那么考虑这种因素是相关。因此我们对这些因素进行相关那么考虑这种因素是相关。因此我们对这些因素进行相关性建模,我们使用随机效用。在本题中,我们规定年龄、性建模,我们使用随机效用。在本题中,我们规定年龄、检查时刻为随机效应,即使得具有相同年龄水平或相同检检查时刻为随机效应,即使得具有相同年龄水平或相同检查时刻的水平之间存在共同的相关性,那么,此模型才较查时刻的水平之间存在共同的相关性,那么,此模型才较为合理。为合理。现在学习的是第2

24、8页,共35页3.混合线性模型混合线性模型2 对对4种疗法的疗效模型的建立种疗法的疗效模型的建立1)数据的处理)数据的处理a、所有病人的年龄是在、所有病人的年龄是在14.9021,74.193的区间内的区间内,以以(74.193-14.9021)/5=11.85818为区间长度。我们将患者为区间长度。我们将患者按照年龄阶段分为按照年龄阶段分为5级,分别记作级,分别记作1至至5(如表(如表4所示);所示);b、我们将患者所接受的治疗方法分为、我们将患者所接受的治疗方法分为4种,分别记作种,分别记作1至至4;c、我们将病人的检查的时刻、我们将病人的检查的时刻0,40以以10为区间长度,为区间长度,

25、分为分为4级,分别记作级,分别记作1至至4 现在学习的是第29页,共35页3.混合线性模型混合线性模型现在学习的是第30页,共35页3.混合线性模型混合线性模型2)确定固定效应和随机效应)确定固定效应和随机效应固定效用是设计者所研究的因素,在此题中为固定效用是设计者所研究的因素,在此题中为4种疗法。因为病人的年龄是随机的,并且病种疗法。因为病人的年龄是随机的,并且病人接受检验的时刻是也是随机进行的,故病人人接受检验的时刻是也是随机进行的,故病人的年龄和病人接受检验的治疗时刻应该为随机的年龄和病人接受检验的治疗时刻应该为随机效应。效应。现在学习的是第31页,共35页3.混合线性模型混合线性模型3

26、)协方差结构的选择)协方差结构的选择模型中具体选用哪种结构矩阵:在相同模型结构下,选模型中具体选用哪种结构矩阵:在相同模型结构下,选择几个不同结构的协方差矩阵,从中选取似然比统计量择几个不同结构的协方差矩阵,从中选取似然比统计量(-2Log Likeli-hood)、)、Akaikes Information Schwartz Bayesian三个指标均较小的一个,通常以三个指标均较小的一个,通常以AIC为主要判断指标。依据专业知识和既往文献,在此模为主要判断指标。依据专业知识和既往文献,在此模型中选用符合对称结构型中选用符合对称结构CS、不规则结构、不规则结构UN、一阶自、一阶自回归结构回归

27、结构AR(1)、空间幂相关结构、空间幂相关结构 SP(POW)。现在学习的是第32页,共35页3.混合线性模型混合线性模型4)建立混合线性模型的线性模型,如下:)建立混合线性模型的线性模型,如下:现在学习的是第33页,共35页3.混合线性模型混合线性模型data ex;input name a x1 x2 y;if x126.76 then x1=1;if 26.76=x141.662 then x1=2;if 41.662=x156.56 then x1=3;if 56.56=x171.467 then x1=4;if 71.467=x1 then x1=5;if x210 then x2=

28、1;if 10=x220 then x2=2;if 20=x230 then x2=3;if 30=x2 then x2=4;cards;1 2 36.4271 0 3.13551 2 36.4271 7.5714 3.04451 2 36.4271 15.5714 2.77261 2 36.4271 23.5714 2.8332现在学习的是第34页,共35页3.混合线性模型混合线性模型1313 1 15.8412 20 4.40671313 1 15.8412 27 3.55531313 1 15.8412 35 3.4657;proc glm;class a x1 x2;model y=a x1 x2;means a/duncan;proc mixed;class a x1 x2;model y=a;random x1 x2;lsmeans a;run;现在学习的是第35页,共35页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁