全国大学生数学建模大赛2006B全国一等奖论文.doc

上传人:e****s 文档编号:61750297 上传时间:2022-11-21 格式:DOC 页数:33 大小:85.50KB
返回 下载 相关 举报
全国大学生数学建模大赛2006B全国一等奖论文.doc_第1页
第1页 / 共33页
全国大学生数学建模大赛2006B全国一等奖论文.doc_第2页
第2页 / 共33页
点击查看更多>>
资源描述

《全国大学生数学建模大赛2006B全国一等奖论文.doc》由会员分享,可在线阅读,更多相关《全国大学生数学建模大赛2006B全国一等奖论文.doc(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2006高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规那么.我们完全明白,在竞赛开始后参赛队员不能以任何方式包括 、电子邮件、网上咨询等与队外的任何人包括指导教师研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规那么的, 如果引用别人的成果或其他公开的资料包括网上查到的资料,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规那么,以保证竞赛的公正、公平性。如有违反竞赛规那么的行为,我们将受到严肃处理。 我们参赛选择的题号是从A/B/C/D中选择一项填写: B 我们的参赛报名号为如果赛区设置报名号

2、的话:所属学校请填写完整的全名: 云南大学 参赛队员 (打印并签名) :1. 李远壮 日期: 2006 年 9 月 18 日 指导教师或指导教师组负责人 (打印并签名): 王顺芳、王瑞赛区评阅编号由赛区组委会评阅前进行编号:2006高教社杯全国大学生数学建模竞赛 编 号 专 用 页 赛区评阅编号由赛区组委会评阅前进行编号: 全国统一编号由赛区组委会送交全国前编号: 全国评阅编号由全国组委会评阅前进行编号: 艾滋病疗法的评价及疗效的预测摘要问题一中,通过对附件1中的测量数据分析,发现各个患者的历史测量数据较少47组,且每两次测量具有非等时距性。针对数据的特点,建立有机灰色神经网络预测模型1对每个

3、患者继续治疗效果进行预测:首先建立灰色系统的无偏GM(1,1)模型、非等时距GM(1,1)模型、PGM(1,1)模型2,分别求出各模型的预测值,然后引入残差GM(1,1)模型3对各个预测值进行修正,由于历史数据较少使得灰色系统的预测值只能给出治疗效果的大致开展趋势。修正后的预测值和实际测量值作为人工神经网络4的一组样本,预测值作为输入数据,实际测量值作为期望输出,输入数据从输入层单元传到隐藏层单元,经隐藏层单元逐层处理后再发送到输出层单元,如果在输出层得不到期望输出,那么转入逆向传播过程,将实际值与网络输出之间误差沿原来联结的通路返回,通过修改各层神经元的联系权值,使误差减少,然后再转入正向传

4、播过程,反复迭代,直到误差小于给定的值为止.。最终使模型能较准确预测每个患者的治疗效果,如对23451患者的预测知该患者应停止现在所使用的治疗方法,寻求更适宜的治疗方式。同正态分布的置信区间结合后,模型最终可得出一总体预测:该疗法在70周左右的范围有较好的疗效,之后治疗效果逐渐变差,大多数患者的病情会发生恶化。问题二中采用随机区组设计的两因素方差分析方法5,对四种疗法优劣进行评价。首先对附件2中的数据参照年龄和测试时间的不同进行归类,按照不同年龄段将数据归为10类,针对不同测试时间将数据归为六类;对经过处理的数据进行分析,建立疗效的正态分布模型6,以置信水平0.95为标准,分别求出4个正态分布

5、模型的置信区间,通过对置信区间的数据进行分析,得到如下结论:600mg zidovudine 加 400mg didanosine,再加400mg nevirapine的疗法效果最好。而继续治疗效果的预测方法同于问题一,只是在建立有机灰色神经网络预测模型之前对数据进行了分类处理,最终得出25-28年龄区间的继续治疗效果很好,可以长期接受这种疗法;而33-36,45-48年龄区间的人群应该立即寻找其他方法进行治疗,总体上,继续治疗的效果不显著。针对问题三,在问题二的根底上,考虑到药品价格和治疗效果对方法选择的制约,我们建立了多级权重模型7,求出合理权重组合的综合评价值。其包含两个方面权重的比拟,

6、即治疗效果的权重和治疗费用的权重。对综合评价矩阵8进行处理,得出选择矩阵,经过变化,得到等价的百分比矩阵,通过对百分比矩阵的分析,得出如下结论:在综合考虑治疗效果和治疗费用后,600 mg zidovudine加400 mg didanosine的疗法最容易被患者接受。 关键词:治疗效果的预测;有机灰色神经网络;无偏GM1,1模型;非等时距GM1,1模型;PGM(1,1)模型;残差GM1,1模型;随机区组设计;正态分布;置信区间 - 1 -1 问题重述艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合

7、症,英文简称AIDS,它是由艾滋病毒医学全名为“人体免疫缺损病毒, 英文简称HIV引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。艾滋病治疗的目的,是尽量减少人体模型假设1、 预测阶段每两次测量的时间间距相同,为15周;2、 各样本是相互独立的随机样本,且来自正态分布总体。3、 各样本的总体方差相等,即方差齐性。 3 符号说明- 2 -问题一的变量x(0): 离散的时间数据序列(0)x(1): 对x序列作一次累加生成

8、的1AGO序列 : 紧邻均值生成序列: 基于x预测序列 (0)z(1)(0)x-D: 平均模拟相对误差Dk: k点模拟相对误差wji: 第j层第i个神经元的层权WH,m: 输入层的权矩阵Vn,H: 隐含层的权矩阵Dm:输出层各联接权的修改量组成的向量 0DH:隐含层各联接权的修改量组成的向量 h o: 隐含层的输出向量 1o:输出层的输出向量 2 问题二的变量G:第i个年龄阶段 i QSikj:第i个年龄段、第k种疗法,第个j测试时间的CD4的平均浓度 ikj: 第i个年龄区间、第k种治疗方法、第j个测试时间的CD4的浓度W(i,j):第i个年龄区间、第j个测试时间的区组 T-j:第j个观测时

9、间区间 :总平方和 :区组平方和 ssssrrss:处理平方和 tsse:试验误差平方和 - 3 - 问题三的变量Mi1:第i种方法的费用 R:第i种方法的治疗效果A:第k种治疗方法 kan:治疗效果的权重4 问题分析 5、模型的建立与求解5.1、预测继续治疗的效果a: 问题分析此题要求利用附件1的数据,预测继续治疗的效果,这是一个典型的“根据数据预测未来开展趋势的模型,而灰色系统中的灰色预测模型能够根据现有的少量信息进行计算和推测,先根据自身数据建立动态微分方程,再预测自身的开展,特别适合“少数据建模.针对灰色预测对波动较强的序列只能预测大致变化趋势的缺陷,结合灰色理论中在根本GM(1,1)

10、模型根底上引申出的无偏GM(1,1)、非等时距GM(1,1)、PGM(1,1)和BP神经网络的特点,建立有机灰色神经网络预测模型.其中灰色系统的三个GM(1,1)模型的输出将作为神经网络模型的输入.但由于所给记录资料不全面,故模型得出的结果未必符合实际。 b: 模型建立由于附件中给出了300多名患者的资料,记录相当庞大,我们无法对所有数 - 4 -据进行完整分析,应选取其中的50名患者数据,就下述三种模型运用MATLAB 软件编程逐一预测,并应用残差模型对预测值进行修正,修正后的预测值将作为 神经网络的输入。就预测阶段的检测时间,据“全国性病麻风病控制中心资料 显示,HIV和CD4这两项指标的

11、监测间隔时间最好是34个月,为优化模型, 我们选15周为监测间隔时间。以下首先建立GM(1,1)的三个预测模型。 5.1.1 无偏GM(1,1)模型假设存在一组时间数据序列x(0)=x(1), (0)x(0)(2), K,x(n) (0)其中x(k)0,k=1,2,K,n;1 对x序列作一次累加生成1 AGO序列: (0)(0)x(1)(1)=x(1), k0(1)x(1)(2), K,x(1)(n) 其中x(k)=x(k),k=1,2,K,n;i=12 求解紧邻均值生成序列,也可称作背景值,模型如下: (1)z(1)= z(1)(2), z(1)(3),K,z(1)(n) 其中z(k)=0.

12、5(x(1)(k) + x(1)(k-1) ), k= 2, 3, K,n。 假设 a =a,b 为参数列,且(0)(2)x(0)(3) Y=x , B=M(0)x(n)(1)(2)-z(1)-z(3) M(1)-z(n)11 M1那么无偏GM(1,1)模型的参数2-a2b, A=, a= ln2+a2+a3 建立原始数据序列模型xx(0)(1)=x(1), 5-1-1 (k) = Aea(k-1)(0)(0) , k=2 , 3 K,n.该无偏差模型不须经过累减过程而直接得到我们所要的预测值,并且与 GM(1,1)模型相比,它不存在GM(1,1)模型所固有的偏差,因而也消除了传统 GM(1,

13、1)模型在原始数据序列增长较大时失效的现象,这也是我们选该模型的 - 5 -出发点。 5.1.2 非等时距GM(1,1)模型非等时距GM(1,1)模型是针对时间间距不等的离散数据进行预测的模型。 其根本思路是:把时间变化的一随机正的数据列,通过适当的方式累加,使 之变成一非负递增的数据列,用适当的曲线逼近,以此曲线作为预测模型, 对系统进行预测。假设有一组不等时间间距的离散数据:x1(0)(1), x (0)(2), x(0)(3), K, x(0)(n) 另外有该离散数据组所对应的时间组: t, td(1)2,t, K, t3(1)n 微分方程 dt(1)+ax=u 5-1-2 时间响应x(

14、1)u-atu(1)(t)=(x(0)-)e+ 5-1-3 aa离散响应x(k)=(x(0)-u)e(1)(1)-a(k-1)+u 5-1-4 a上诉各式中:x(k)为预测值的一次累加量;a,u为实测数据建模所得的模型参数。在数据的累加累减中采用下面的格式:原始数据列x(k)k=1,2,K,n,其x(k)与x(k-1)之间的时间 间距为tk-tk-1,其中tk(k=1,2,K,n),为x(k)与x(1)间的总时间间隔,那么原始数据的一次累加式为: (0)(0)(0)(0)(0)xx(1)(k)=x(1)(0)(k) (k=1) 5-1-5 (0)(1)(k)=x(k-1)+(tk-t(k-1)

15、x(k) (k2) 5-1-6(1)经过上诉公式计算,x(k)成为非负递增序列。经过GM(1,1)模型预测所得的预测值的累加量(1)x(k)作一次累减得到预测值(1)x0(k):- 6 -(1)x0(1)(k)=(1)x(1)(k) k=1) 5-1-7 (1)x0(k)=x(k)x(k-1) k2) 5-1-8 数据处理-(1)(2)+(1)(1)/21xxB=M M (1)(1)-(n)+x(n-1)/21xY=(x(2),x(3),K,x(n)T (0)(0)(0)a=a,uT 计算aa=(BTB)-1BY 5-1-9 T由7式得出的a,u代入56式,所得值代入78进行累减处理, 即为所

16、求得的预测值。 5.1.3 PGM(1,1)模型该模型建立的根底是GM(1,1)模型,为此下面将首先建立GM(1,1)模型: 假设有数列:X=(x(1),x(2),K,x(n) 经一次累加后得到 0(0)(0)(0)X1=(x(1),x(2),K,x(n) ,那么称 (1)(1)(1)x(0)(k)+ax(k)=b 5-1-100(1)(1)(1)(1)为GM(1,1)模型的原始形式。 由紧邻生成数列Z=(z(2),z(3),K,z(n)导出的x(0)(k)+az(k)=b 5-1-11(1)(1)(1)为GM(1,1)模型的根本形式。而数列中的 z(1)(k)=0.5(x(k)+x(k-1)

17、,k=2,3,K,n. 假设设a=a,bT为参数列,且- 7 -(0)(2)x(0)(3)Y=x , B=M(0)x(n)(0)(1)(2)-z(1)-z(3) M(1)-z(n)11 M1 那么GM(1,1)模型x(k)+az(k)=b的最小二乘估计参数满足a= (1)(BB)T-1BY 5-1-12 T由此求出a,b代入x(k)+az(k)=b模型的时间响应序列(1)(0)(1)x(0)(k)=(x(0)-b)e(1)-a(k-1)+b 5-1-13 a将此序列作累减处理即 x(k)=x(k)-x(k-1) 5-1-14 (1)(1)所得的数值即为GM(1,1)模型的预测值。dx在GM(1

18、,1)模型中,灰色微分方程中的所对应的背景值取法为: dt1 zt=(x(t+1)+xt) 5.-1-15 2通常情况下,我们认为在t=1的很短时间 5-1-16而p的最正确选择根据实测值与预测值的平均模拟相对误差最小的到。模型如下:1nD =Dk 5-1-17 nk=1其中Dk=e(k)x(0)(0)(k)为k点模拟相对误差,e(k)=x(0)(k) (0)x(k)x(k)为 (0)实测值,x(k)为预测值。确定P值是我们求解模型的关键,当D最小时所对 应的p值即为我们所求的权值。为此我们建立了循环模型,p的初值被赋予0.01, 每用PGM(1,1)模型预测并求出对应的平均模拟相对误差后,

19、p值增0.01, - 8 -一直到p值为0.99,比拟各次所得平均模拟相对误 差后,平均模拟相对误差后 最小时所对应的p值即为我们所建模型的权。最后根据11式利 用PGM(1,1) 模型求解相对准确的预测值。 5.1.4 残差GM(1,1)模型虽然无偏GM(1,1)模型、非等时距GM(1,1)模型、PGM(1,1)模型在预测数值的准确性上较GM(1,1)模型有很大提高,但预测出的数据仍然存在某种程度上的偏差,为得到更准确的预测数据,我们建立了残差GM(1,1)模型对预测所得的数值进行修正。模型如下:设X(0)为原始序列,X(1)为X0(0)的1AGO序列,X(1)为基于X(0)的预测序列值。建

20、立X(1)的残差序列e有: 其中,e0e0=e(0)(1),e(1)(0)(2),K,e(0)(n) (0)(k) =x(1)(k)-(k)。假设存在k0,满足 x 1kk0,e(0)(k)的符号一致; 2 n-k004,那么称(k0)|,|(0) | e(0)e(0)(k0+1)|,K,|e(0)(0)(n)| 为残差尾段,仍记为 e0=e(k0),e(0)(k0+1),K,e(n)建立残差尾段的1AGO序列e(1)=e(k0),e(k0+1),K,e(n) (1)(1)(1)该序列的GM(1,1)模型的时间响应式为 e(1)(k+1)=(e(0)(k0)-eexp-ae(k-k0)+ee,

21、kk0 (5-1-18) e0该式中的ae,be含义等同与上诉GM(1,1)模型的a,b。那么残差尾段e的模拟序列为 其中 e0=(0)e(k0),e(0)(k0+1),K,e(0)(n) e(0)(k+1)=-aee(0)(k0)- 9 - eexp-ae(k-k0) ,kk0 e5-1-19用e0修正X(1)后的时间响应式b-akb(0)(1)-)e+,kk0x(1)aa (k+1)=bb(0)-ak(0)-(k-)X(1)-)e+ae(e(k0)-e)eaek0,kk0xaaae(5-1-20)为残差修正GM(1,1)模型,简称残差GM(1,1)。其中残差修正值e0(k+1)= ae(e

22、0(0)-(k-)(k0)-e)eaek0 (5-1-21) ae 的符号应与残差尾段e的符号保持一致。利用该残差模型,对上诉三个GM(1,1)模型预测的数据进行修正,得到 相对准确的预测值作为神经网络模型的输入。 5.1.5 BP神经网络模型神经网络都是可调节的,或者说可训练的,一个特定的输入通过不断训练 可得到要求的输出。如下列图所示。这里,网络根据输出和目标的比拟而调整, 直到网络输出和目标匹配。 图5-1-1 典型的BP网络模型9即误差反向传播神经网络是神经网络模型中使用最广泛的一类。以下是网络的拓扑结构 - 10 -(1)(2)(3)(l) 输入层 隐藏层 输出层图5-1-2BP神经

23、网络的学习过程分为信息的正向传播过程和误差的反向传播过程两个阶段. 外部输入的信号经输入层、隐藏层的神经元逐层处理向前传播到输出层给出结果. 如果在输出层得不到期望输出,那么转入逆向传播过程,将实际值与网络输出之间误差沿原来联结的通路返回,通过修改各层神经元的联系权值,使误差减少, 然后再转入正向传播过程,反复迭代,直到误差小于给定的值为止.每次构建网络都须有一组样本值X,Y和权值W向量,X表示输入向量,Y表示理想输出向量,用来与实际输出向量相比拟。神经元的网络输入: 其中xineti=x1w1i+x2w2i+LL+xnwni 5-1-22 X (i=1,2,LLn),wjiW (j=1,2,

24、LL,n),表示第j层对第i个神经元的层权,权必须初始化为不同的小随机数且是饱和状态以保证网络可学。神经元的输出: 1o=f(net)=1+e-net (5-1-23)12f(net)=o-o=o(1-o) (5-1-24) -net2(1+e)向前传播阶段:(1) 从样本集中取一个样本(XP,YP),将XP输入网络;(2) 计算相应的实际输出Op:OP=FL(L(F2(F1(XPW(1)W(2)L)W(L)- 11 -向后传播阶段误差传播阶段:(1) 计算实际输出Op与相应的理想输出Yp的差;(2) 按极小化误差的方式调整权距阵;(3) 网络关于第P个样本的误差测度:(1) Ep1=22(y

25、-o) (5-1-25) pjpjj=1m(4)网络关于整个样本集的误差测度:E误差传播分析: =EppANpAN第L-1层 第L层输入层权的调整图 5-1-3Wpq=Wpq+DWpqDWpq=adqop=afn(netq)(yq-oq)op=aoq(1-op)(yq-oq)op- 12 - 第k-2层 第k-1层 第k层隐藏层权的调整图 5-1-4dpk-1的值和d1k,d2k,LL,dmk有关,可认为dpk-1通过权wp1对d1k做出奉献; 通过权wp2对d2k做出奉献; 通过权wpm对dmk做出奉献。dpk-1=fk-1(netp)(wp1d1k+wp2d2k+LL+wpmdmk)vhp

26、=vhp+DvhpDvhp=adpk-1ohk-2=afk-1(netp)(wp1d1k+wp2d2k+LL+wpmdmk)ohk-2=aopk-1(1-opk-1)(wp1d1k+wp2d2k+LL+wpmdmk)ohk-2首先我们讨论根本的BP算法:逐一地根据样本(XK,YK)计算出实际输出ok和误差测度E1,W(1),W(2),LL,W(L)各做一次调整,重复这个循环,直到Epe那么重复第四部直至2Ee时算法结束。算法的缺点:由于Bp网络接受样本的顺序是“分别、“依次,所以样本的输入顺序对训练结果有很大的影响,靠后的数据假设是发生了突变,所建模型的可靠性降低,而针对本问题,每个人的随机因

27、素很多,而且历史数据只有5至8个。顺序的影响将很大,所以算法需要改良才能满足模型需要。针对上述缺点,我们采用总效果(x1,y1),(x2,y2),LL,(xs,ys)修改W(1),W(2),LL,W(L),令Dwij(k)(k)=Dpwij。具体算法描述如下:(k)(k)W第一步,初始化,同样不用考虑W初始时的具体值。第二步,初始化精度控制参数e。第三步,使E=e+1。第四部,令E=0,对所有的i,j,k:Dwij=0。对模型中的每一个样本(k)(xp,yp)计算出xp对应的实际输出op和Ep,令E=E+EP,对所有i,j根据计算出(L)Dwij(k)(k)Dwij=Dpwij。对所有i,j:

28、(L)(L)(L)Dwij=Dwij+Dpwij(k)(k)Dwij=Dpwij,令k=L-1,对所有i,j出(k)Dwij根据i,j计算,对所有:(k)(k)(k)Dwij=Dwij+Dpwij并令k=k-1,直到k=0。对所有i,j,k:(k)(k)(k)Ewij=wij+Dwij,最后令E=,假设Ee那么重复第四部直至Ee时2算法结束。- 14 -算法的优缺点:较好的解决了因样本的顺序引起的精度问题和训练的抖动问题。但是算法的收敛速度比拟慢,可以给每一个神经元增加一个偏移量来加快收敛速度。算法有待改良.引入冲量:即连接权的本次修改要考虑上次修改的影响,以减少抖动。 主要数据结构:WH,m

29、 - 输入层的权矩阵;Vn,H - 输入隐藏层的权矩阵;Dom - 输出层各联接权的修改量组成的向量;DhH - 隐藏层各联接权的修改量组成的向量;o1 - 隐藏层的输出向量;o2 - 输出层的输出向量;(x,y) - 一个样本。算法的主要实现步骤:第一步,用不同e的小伪随机数初始化W,V,可在Matlab中随机生成; 第二步,初始化精度控制参数e;学习率a;第三步,循环控制参数E=e+1;循环最大次数M,循环控制参数N初始为0; 第四部,当Ee且N<M,转到第五步,否那么转到第六步;第五步,N=N+1,E=0;对每个样本(x,y):计算o1=F1(XV);o2=F2(o1W);计算输出

30、层的权修改量:D0=i=o2i(1-o2i)(Yi-o2i)(i=1,2,L,m)计算误差E=E+(Yi-o2i)2 (i=1,2,L,m)计算隐藏层的权修改量:首先令Z=0;Z=Z+Wi,jDoj;Dhi=Zo1i(1-o1i); (i=1,2,L,H,j=1,2,L,m)修改输出层权矩阵:W=k,i=Wk,i+ao1kDoi式中 (k=1,2,L,H,i=1,2,L,m)修改隐藏层权矩阵:Vk,i=Vk,i+aXkDhi- 15 -(k=1,2,L,n,i=1,2,L,H)第六步,算法结束。上述算法的理论根底见参考文献9上述逐步改良算法,可以作为此题模型建立的根本算法。本模型中,输入变量为

31、每个HIV患者的CD4和HIV病毒通过NTGM(1 ,1) 、WPGM(1 ,1) 、p GM(1 ,1)模型建立的预测值,输出层的输出结果与实际值做比拟。具体算法思想如下:(1) 由观察知道,病人测量HIV和CD4的时间间隔不相同,为非等时距序列,故采用NTGM(1 ,1) 、WPGM(1 ,1) 、p GM(1 ,1) 分别建立预测模型,其预测结果作为神经网络的输入.(2) 有机灰色神经网络拓扑结构m=5大多人测量次数为5次 为原始序列长度, n =5(预测5次测量结果)为预测所得序列的长度.(3) 由参考文献:增加隐藏层的层数和隐藏层神经元的个数不一定总能提高网络精度和表达能力。一般采用

32、二级网络,而此题的实验数据较为敏感,影响较大,因此此题采用四层神经网络,两个隐藏层的结构为( p ,q) ,其中p 第一个隐藏层的节点个数, q 为第二层隐藏层的节点数.(4) OGN 建模步骤如下:对于一个测量浓度序列, 分别采用NTGM(1 ,1) 、WPGM(1 ,1) 、p GM(1 ,1) 分别求得5个模模拟值和5个预测值; 预设神经网络结构(p,q) 为(1 ,1) ;以三组灰色模型的模拟值为输入模式, 原始一维序列为输出模式,进行神经网络权值训练,记录下对应网络结构的样本集总误差E;分别将p 和q 各自增加1 ,如果p = q =11 ,转,否那么转;选出以上10 个E 中最小值

33、对应的(p,q) ,记为(p0,q0) ;分别按照(p0,1)、(p0,2) (2,q0)、(p0,10) 、(1,q0)、(10,q0)的结构按求得20个E;选出以上20 个E 中最小者对应的(p,q) ,记为(p1,q1) ;将中的三组5 个预测值作为输入值,按照(p1,q1) 的网络结构进行仿真, 求得的输出的5 个值就是OGN 的预测值.根据上述思想,我们利用matlab中的newff、train、sim、initwb等函数建立网络、初始化权重、学习因子,并对数据训练,输出层输出数据,并最终得出5个预测值,下面以几个患者的测量数据作为例子说明:一位患者在第0,4,8,24,39周进行了

34、HIV病毒的测量:5.3000,3.0000,2.6000,2.6000,2.6000。这五个数据作为NTGM(1 ,1) 、WPGM(1 ,1) 和p GM(1 ,1)模型的输入,这三个模型最后得出T1=5.3000 3.1641 3.0431 2.9333 2.8328- 16 -5.3000 2.7140 2.7934 2.8752 2.95945.3000 2.5137 2.5264 2.5392 2.5521T2=2.7399 2.6535 2.5724 2.4958 2.42323.0460 3.1351 3.2269 3.3214 3.41862.5650 2.5780 2.59

35、11 2.6042 2.6174T1为三个系统对原始数据的模拟,可看出除了第一个数据外其他数据都有误差,说明灰色理论的单独作用不能使模型到达较高精度,总存在模拟失真。故灰色理论在精度要求和灵敏度分析较高的模型并不能胜任工作。结合神经网络,作为模型的二级输入,使模拟值与预测值耦合更密切,通过神经网络后的模拟值为:5.3000,3.0000,2.6000,2.6000,2.6000,可看出,这与原始数据完全一致,即在规定的步数内到达了训练目标,由此再利用T2(T2为三个灰色系统的预测值)的值进行仿真预测,得出未来第54,69,84,99,114周的预测值为:2.57892.5838 ,2.5878

36、, 2.5968 ,2.5998。可看出来未来75周内继续服用药物可使HIV病毒控制在2.6以下。但是由预测值看出HIV病毒有很小的增幅,患者应该继续服用药物。另外一位患者在第0,4,9,23,42周的CD4浓度测量结果为:96,79, 92 ,257 ,137单位:乘以2/ml。利用所建模型预测出这位患者在未来第57,72,87,102,117周CD4的浓度为:132.2000,132.2000,132.2000,132.1992 ,132.1554单位:乘以0.2/ml。由此预测序列可知这位患者在未来75周内继续服用药物CD4的浓度最多为1320.2/ml,并在第102周时浓度略有下降,治

37、疗效果并不理想,因此应该建议该患者停止此种治疗方法,寻求更适宜自己身体的治疗方式。5.1.6 模型与正态分布结合 上述模型可以对每个做过测试的患者进行治疗效果预测,为使模型适用于未做过测试的患者,需要对300个患者的预测结果得出此治疗方法的一般性结论。 选取260个患者预测出他们在未来5次测量时的CD4和HIV病毒含量。假设260个患者每一次的预测结果满足于正态分布,并利用matlab中的H,s=jbte(Xst,a)10函数实现jarque-Bera假设检验算法,返回的的参数H=0,说明数据满足正态分布11,假设成立。根据最大似然估计法11对260个患者每次的预测值进行参数估计, n2根据m

38、=X,s=(Xi-X)ni=111计算出m和s。因此可绘制出每次预测2值的概率密度函数曲线。分别对5次CD4含量的260个预测值求出m=173.2910 ,172.2418,165.平为95.44%的置信区间,分别为:154.6293,191.9527;153.4748,191.0088;146.4311,184.8974;140.9880,179.4958;140.9840,179.4929;这说明被治疗的患者中有95.44%在第一预测时CD4的浓度在154.6293,191.9527的范围内,第二次预测95.44%的患者CD4的浓度在153.4748,191.0088的范围内,依次类推,发

39、现每次预测时患者CD4的浓度逐渐减小。同理,描绘出5次对患者HIV病毒含量预测值的概率密度函数曲线: - 18 - (图5.1-6) 同理求得5次预测置信水平为95.44%的置信区间:0.7058,5.4519;0.7725,5.7382;0.7977,5.7927;0.7305,5.7935;0.8324,5.9644说明每次预测时患者HIV病毒浓度逐渐增大。综上,5次对患者CD4和HIV病毒含量的预测呈现出95%以上的患者CD4浓度逐渐减少,同时95%以上的患者HIV病毒浓度逐渐增加。这和题目所述“当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加相吻合,说明CD4和HIV病

40、毒是负相关的。CD4浓度逐渐减少, HIV病毒浓度逐渐增加说明这种治疗方式最终将失去作用。观察两个概率密度函数曲线图,发现第3次预测的CD4浓度的置信区间明显变小,而HIV病毒浓度的置信区间在第2次预测时也发生了较大增加,故患者应该在第2次或者第3次预测的时间范围内停止此种治疗方法,寻找其它治疗方式。由于患者的历史测量数据的时间范围一般为0到40周,而后面的预测值都是基于每个15周预测一次的假设。可得出结论:这种治疗方法在40+30=70周左右的范围有较好的疗效,之后治疗效果逐渐变差,大多数患者的病情会发生恶化。5.1.7 模型的改良本模型显著提高了预测精确度,但建立模型的过程没有考虑历史测量数据的权重问题,在灰色模型建立时,考虑患者5次测量数据对预测的影响权重,以使模型更精确地预测出继续治疗效果。 - 19 -5.2 疗法的优劣评价及预测最优疗法继续治疗的效果a: 问题分析对于各种疗法之间疗效的比拟,我们建立了随机区组设计的两因素方差分析模型,由于随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,即两因素实验设计,比完全随机设计的检验效率高。故随机区组设计模型在比拟各种疗法之间疗效时比其他模型更好。b: 模型建立方差分析ANO

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理手册

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁