《福建农林大学-数学建模培训-mcm2006B艾滋病疗法的评价及疗效的预测2010.5.15-课件.ppt》由会员分享,可在线阅读,更多相关《福建农林大学-数学建模培训-mcm2006B艾滋病疗法的评价及疗效的预测2010.5.15-课件.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、艾滋病疗法的评价艾滋病疗法的评价及疗效的预测及疗效的预测2006 艾滋病是当前人艾滋病是当前人类类社会最社会最严严重的瘟疫之一,从重的瘟疫之一,从1981年年发现发现以来的以来的20多年多年间间,它已,它已经经吞噬了近吞噬了近3000万人的生命。万人的生命。艾滋病的医学全名艾滋病的医学全名为为“获获得性免疫缺得性免疫缺损综损综合症合症”,英文,英文简简称称AIDS,它是由艾滋病毒(医学全名,它是由艾滋病毒(医学全名为为“人体免疫缺人体免疫缺损损病毒病毒”,英英文文简简称称HIV)引起的。)引起的。这这种病毒破坏人的免疫系种病毒破坏人的免疫系统统,使人体,使人体丧丧失抵抗各种疾病的能力,从而失抵
2、抗各种疾病的能力,从而严严重危害人的生命。人重危害人的生命。人类类免疫系免疫系统统的的CD4细细胞在抵御胞在抵御HIV的入侵中起着重要作用,当的入侵中起着重要作用,当CD4被被HIV感染而裂解感染而裂解时时,其数量会急,其数量会急剧剧减少,减少,HIV将迅速增加,将迅速增加,导导致致AIDS发发作。作。艾滋病治艾滋病治疗疗的目的,是尽量减少人体内的目的,是尽量减少人体内HIV的数量,同的数量,同时产时产生更多的生更多的CD4,至少要有效地降低,至少要有效地降低CD4减少的速度,以提减少的速度,以提高人体免疫能力。高人体免疫能力。迄今为止人类还没有找到能根治迄今为止人类还没有找到能根治AIDS的
3、疗法,目前的一的疗法,目前的一些些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的和医疗组织都在积极试验、寻找更好的AIDS疗法。疗法。现在得到了美国艾滋病医疗试验机构现在得到了美国艾滋病医疗试验机构ACTG公布的两组数公布的两组数据。据。ACTG320(见附件(见附件1)是同时服用)是同时服用zid.,lam.,ind.3种药种药物的物的300多名病人每隔几周测试的多名病人每隔几周测试的CD4和和HIV的浓度的浓度(每毫升血(每毫升血液里的数量)。液里的数量)。193A(见附件(见附件2)是将)是将13
4、00多名病人随机地分多名病人随机地分为为4组,每组按下述组,每组按下述4种疗法中的一种服药,大约每隔种疗法中的一种服药,大约每隔8周测试周测试的的CD4浓度浓度(这组数据缺(这组数据缺HIV浓度,它的测试成本很高)。浓度,它的测试成本很高)。4种种疗法的日用药分别为:疗法的日用药分别为:600mg zid.或或400mg did.,这两种药按,这两种药按月轮换使用;月轮换使用;600 mg zid.加加2.25 mg zal.;600 mg zid.加加400 mg did.;600 mg zid.加加400 mg did.,再加,再加400 mg nev.。请你完成以下问题:请你完成以下问题
5、:(1)利用附件)利用附件1的数据,的数据,预测继续治疗的效果,或者确定预测继续治疗的效果,或者确定最佳治疗终止时间最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件)利用附件2的数据,的数据,评价评价4种疗法的优劣种疗法的优劣(仅以(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价艾滋病药品的主
6、要供给商对不发达国家提供的药品价格如下:格如下:600mg zid.1.60美元,美元,400mg did.0.85美元,美元,2.25 mg zal.1.85美元,美元,400 mg nev.1.20美元。如果病人需要考虑美元。如果病人需要考虑4种疗法的费用,对(种疗法的费用,对(2)中的评价和预测(或者提前终止)有)中的评价和预测(或者提前终止)有什么改变。什么改变。附件附件2 193A数据数据1300多名病人按照多名病人按照4种疗法服药大约每隔种疗法服药大约每隔8周测试的周测试的CD4浓度。浓度。第第1列是病人编号,第列是病人编号,第2列是列是4种疗法的代码:种疗法的代码:第第3列是病人
7、年龄,第列是病人年龄,第4列是测试列是测试CD4的时刻(周),第的时刻(周),第5列是测列是测得的得的CD4,取值,取值log(CD4+1).ID 疗法疗法 年龄年龄 时间时间 Log(CD4 count+1)1236.427103.1355 1236.42717.57143.0445 1236.427115.57142.7726 1236.427123.57142.8332 1236.427132.57143.2189 1236.427140 3.0445 2447.84670 3.0681 2447.84678 3.8918 2447.846716 3.9703 2447.846723 3
8、.6109 2447.846730.71433.3322 2447.846739 3.0910 CD4大致有先增后减的趋势,大致有先增后减的趋势,HIV有先减后增有先减后增的趋势,启示应建立时间的二次函数模型的趋势,启示应建立时间的二次函数模型问题(问题(1)利用附件利用附件1的数据,预测继续治疗的效果的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。或者确定最佳治疗终止时间。分析数据分析数据如随机取如随机取20个病人,画出他们个病人,画出他们CD4和和HIV浓度随时间变化的图形(折线),浓度随时间变化的图形(折线),若先用一次模型,应与二次模型做统计分析比较若先用一次模型,应与二次模型做
9、统计分析比较CD4HIV1)总总体回体回归归模型模型 用全部数据用全部数据拟拟合一个模型,如合一个模型,如 yij=b0+b1tij+b2tij2,tij,yij分分别为别为第第i病人第病人第j次次测测量的量的时间时间和和CD4(或(或HIV),估),估计计b0,b1,b2建立模型建立模型有以下形式的回有以下形式的回归归模型(一次模型(一次与二次模型比与二次模型比较较,二次,二次较优较优):):对对HIV,b20,b10,t=-b1/2b2 达到最小达到最小对对CD4,b20,t=-b1/2b2 达到最大达到最大平均地应在平均地应在2530(周)结束治疗。(周)结束治疗。将模型将模型 yij=
10、b0i+b1itij+b2itij2 的系数分解的系数分解:bki=bk+ik(k=0,1,2),设),设 ik服从零均值服从零均值正态分布,利用极大似然估计可以得到正态分布,利用极大似然估计可以得到bk的估计值及的估计值及 ik的方差。的方差。3)纵向数据回归模型纵向数据回归模型bk的估计值用于计算的估计值用于计算CD4的最大点和的最大点和HIV的最小的最小点,它与点,它与 ik的方差一起可以在正态分布假定下的方差一起可以在正态分布假定下计算及时结束治疗与继续治疗的概率。计算及时结束治疗与继续治疗的概率。如果考虑病人初始状态(如果考虑病人初始状态(t=0时的时的CD4和和HIV)的不同对模型
11、的影响,可以将模型)的不同对模型的影响,可以将模型中的中的yij定义为第定义为第i病人第病人第j次测量的次测量的CD4(或(或HIV)与初始值之差或之比。)与初始值之差或之比。或者先按照病人初始状态分类(如轻度、中或者先按照病人初始状态分类(如轻度、中度、重度),然后对于每一类建立回归模型。度、重度),然后对于每一类建立回归模型。建立模型建立模型可以引入可以引入4(或(或3)个)个0-1变量表示变量表示4种疗法建立种疗法建立统一模型,或者对每种疗法各建立一个模型统一模型,或者对每种疗法各建立一个模型(一般来说前者较优)。(一般来说前者较优)。1)回归模型)回归模型以总体回归模型为例,只需增加年
12、龄变量,分别以总体回归模型为例,只需增加年龄变量,分别用一次与二次时间函数模型进行比较,可知疗法用一次与二次时间函数模型进行比较,可知疗法13用一次模型较优,且一次项系数为负,即用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法在减少,从数值看疗法3优于疗法优于疗法2和和1;疗;疗法法4用二次模型较优,即用二次模型较优,即CD4先增后减,先增后减,建立模型建立模型论文中出现问题的评析论文中出现问题的评析 1只做数据拟合,不做统计检验。只做数据拟合,不做统计检验。用回归分析方法做统计检验:用回归分析方法做统计检验:得到的模型有无显著意义,它的置信度多大,用得到的模型有无显著意义,它的
13、置信度多大,用它作预测时准确程度如何。它作预测时准确程度如何。最小二乘拟合:最小二乘拟合:已知一组数据已知一组数据(xk,yk),k=1,2,n 和一个形式已定、和一个形式已定、参数参数 待定的模型(曲线)待定的模型(曲线)y=f(x,),确定参数确定参数 使使数据与模型在误差平方和最小的意义下拟合得最好。数据与模型在误差平方和最小的意义下拟合得最好。有现成的计算公式和软件有现成的计算公式和软件确定参数确定参数 x0123456789y1.041.221.381.591.801.992.212.392.652.83z0.280.612.192.562.491.173.171.292.113.2
14、7y=a1x+b1=0.2013x+1.0040z=a2x+b2=0.2025x+1.0025两个模型的结果一样,但是可靠性和准确性一样吗?两个模型的结果一样,但是可靠性和准确性一样吗?需要做需要做统计检验统计检验!简例简例最小二乘拟合最小二乘拟合yxzx2对原始数据先取平均,再用平均值做拟合对原始数据先取平均,再用平均值做拟合 数据中大多数病人的测试时间是数据中大多数病人的测试时间是0,4,8,(周),(周),个别病人是个别病人是5,7,(周),为了得到(周),为了得到CD4(或或HIV)的变化趋势,先在每个时间点上对的变化趋势,先在每个时间点上对CD4取平均,取平均,再用平均值做拟合再用平
15、均值做拟合这样做有什么问题呢?这样做有什么问题呢?注意:有的时间点上有上百个病人的注意:有的时间点上有上百个病人的CD4,而有的时间点上只有几个病人的而有的时间点上只有几个病人的CD4。数据数据(x,y):x=0,y=0:0.05:2;x=1,y=1:0.05:3;x=2,y=0,2,在图上共在图上共84个点。个点。简例简例对数据对数据(x,y)拟合一条直线,拟合一条直线,得得y=0.7647x+1.0784 先在先在x=0,1,2对对y取平均得到取平均得到3个个点点,再拟合直线,得再拟合直线,得y=1.3333 取平均后的取平均后的3个点在做拟合时的个点在做拟合时的权重相同权重相同;但是但是
16、x=0,1的点都是的点都是41个数据的平均值个数据的平均值,而而x=3的点的点只是只是2个数据的平均值个数据的平均值 3拟合过度拟合过度用用4次、次、5次甚至更高次数的多项式作拟合次甚至更高次数的多项式作拟合 数据的起伏是由与时间本身无关的其它随机因数据的起伏是由与时间本身无关的其它随机因素引起的,不应该用增加时间的高次项来拟合素引起的,不应该用增加时间的高次项来拟合 注意拟合与插值在应用场合的差别注意拟合与插值在应用场合的差别 一般地说,多项式拟合不要超过一般地说,多项式拟合不要超过3次,对于次,对于本题如果用统计检验做显著性分析,可以本题如果用统计检验做显著性分析,可以发现多数情况是以时间
17、的发现多数情况是以时间的2次多项式为好次多项式为好 适用本题的显然是拟合而非插值适用本题的显然是拟合而非插值 4只按照图形做直观的定性判断,不做定量分析只按照图形做直观的定性判断,不做定量分析 为了比较为了比较4种疗法的优劣,对每种疗法的种疗法的优劣,对每种疗法的CD4(或取平均)做散点图(或取平均)做散点图,或折线(散点连线)或折线(散点连线)图图,直观地比较疗法的优劣直观地比较疗法的优劣 没有普遍的指导意义,对于其它问题或数没有普遍的指导意义,对于其它问题或数据,这样做不一定能得到结果据,这样做不一定能得到结果 一种疗法的一种疗法的CD4散点图散点图(或折线图或折线图)在另一种在另一种疗法
18、的上面疗法的上面,从统计意义上并不能表明其显著性从统计意义上并不能表明其显著性 作为数学建模题目应该给出作为数学建模题目应该给出定量的处理方法定量的处理方法!5双指标处理不当双指标处理不当 对于对于CD4和和HIV两个指标的处理,常用的方法是用两个指标的处理,常用的方法是用某种函数形式将二者结合在一起某种函数形式将二者结合在一起.由于由于CD4越大越好,越大越好,HIV越小越好,一些同学取二越小越好,一些同学取二者之差或二者之商为综合指标者之差或二者之商为综合指标.这样简单处理的问题在于,这两个指标量纲不同这样简单处理的问题在于,这两个指标量纲不同,数量级差别较大数量级差别较大.恰当的办法是,先分别将其归一化(如将数值恰当的办法是,先分别将其归一化(如将数值变换到变换到0-1之间),然后取加权平均之间),然后取加权平均.