《{JZ}全国数学建模大赛22C题231.pdf》由会员分享,可在线阅读,更多相关《{JZ}全国数学建模大赛22C题231.pdf(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛承承诺诺书书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、 电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的 , 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照要求的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从中选择一项填写) :我们的参赛报名号为(
2、如果赛区设置报名号的话) :所属学校(请填写完整的全名) :浙江工贸职业技术学院参赛队员 (打印并签名) :.郑济明.王庆松.朱松祥指导教师或指导教师组负责人(打印并签名):王积建日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛编编 号号 专专 用用 页页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):脑卒中发病环境因素分析及干预脑卒中发病环境因素分析及干预摘摘要要关键词关键词:一、一、问题重述
3、问题重述世纪人类倡导人与自然和谐发展,环境因素成为影响健康的重要因素。脑卒中(俗称脑中风)就是与环境因素紧密相关且威胁人类生命的疾病之一。 这种疾病的诱发已经被证实与环境因素有关,其中与气温和湿度存在着密切的关系。对脑卒中的发病的环境因素进行分析,其追求是为了进行疾病的风险评估, 对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人, 或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗组织合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。现从中国某城市各家医院年月至年月的脑卒中发病病例信息
4、以及相应期间当地的逐日气象资料()和 数据(见) 。需解决一下几个问题:问题一:根据病人基本信息,对发病人群进行统计描述。问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题二:查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合、中所得结论,对高危人群提出预警和干预的建议技术指导文件。二、问题分析脑卒中(俗称脑中风)作为威胁人类生命的疾病之一,并且病发的人群受环境因素的影响不断扩展。对脑卒中人群及受环境因素的影响分析来对疾病的风险评估,对脑卒中高危人群能够及时采取干预措施成为一项无疑是一项十分复杂的系统工程。对于问题一,利用中国某城市各家医院年月至年月的脑卒中发病
5、病例信息以及相应期间当地的逐日气象资料()和数据(见) 。通过对已知数据进行统计整理,再利用程序对脑卒中病发者的性别指数、年龄指数、职业指数、月份指数进行合理的统计得出相应数据比率。三、模型假设三、模型假设模型假设:) 发病病例的信息中,若两个病例的信息相同,则视为不同的两我。)以诊断报告进度为准来统计发病人群的数量。)导致脑卒中发病的内在原因只与性别、年龄、职业有关。)导致脑卒中发病的外在原因只与气压、温度和湿度有关。)气压、温度和湿度之间具有相关关系。)月平均气压、月平均最高气压、月平均最低气压具有相关关系。)月平均温度、月平均最高温度、月平均最低温度具有相关关系。)月平均湿度、月平均最高
6、湿度、月平均最低湿度具有相关关系。)关于环境因素如气压、温度和湿度的观测数据都是准确可靠的。)按照国际惯例,发病率以万人群的发病人数来表示。但由于本题是研究某地区的发病人数, 并没有与其它地区比较, 所以在本题分析中, 发病率以发病人数来表示。四、符号说明四、符号说明定义,月平均气压是日平均气压的平均值。月平均最高气压是日平均最高气压的平均值。月平均最高气压是日平均最高气压的平均值。定义,月平均温度是日平均温度的平均值。月平均最高温度是日平均最高温度的平均值。月平均最高温度是日平均最高温度的平均值。定义,月平均湿度是日平均湿度的平均值。月平均最低湿度是日平均最低气压的平均值。N1表示男性病例总
7、数,N2表示女性病例总数,N表示总病例数;五、模型的建立及求解五、模型的建立及求解发病人群数据的预处理发病人群数据的预处理根据已知题意给出的中国某城市各家医院年月至年月的脑卒中发病病例信息以及相应期间当地逐日气象资料,进行如下数据预处理:)以年月至年月的一共个月的脑卒中发病病例为准,其他进度数据应当删除,一共得到个病例.)如果病例的信息中,年龄与职业不符(例如:周岁是老师) 、诊断进度不详、数据明显出错的都不应该考虑在统计范围之内,应当删掉。)对发病人群的统计分析对发病人群的统计分析(问题)性别分析)性别差异性简单分析)性别差异性简单分析男、女性病发比例为Nx1i1i,i 1,2()N其 中
8、,i 1表 示 男 性 ,i 2表 示 女 性 。 经 统 计 ,N 58925,N11 31832,N12 27093,代入()得男、女病发比例分别为和(程序见附录) 。可见男性在脑卒中的病发者要大于女性脑卒中病发人数。) )单因素方差分析单因素方差分析逐月统计男女病例人数,考察在相同进度点上男女人群发病人数是否有显著差异, 给定显著性水平 0.05, 分析结果为F 5.54, 对应的p 0.0206 0.05(见图) , 4.08又查表得F2(r1,n r) F,由于F F0.05(1,46),所以0.05(2 1,48 2) F0.05(1,46)脑卒中发病男女人群有显著差异(程序见附录
9、)。图 男女发病人群的单因素方差分析结果不同年龄段发病人群差异性分析)简单分析)简单分析不同年龄阶段发病比例为Nx2i2i,i 1,2,3,4,5,6()N其中,i 1,2,3,4,5,6分别表示“岁以下” 、 “” 、 “” 、 “” 、 “” 、 “以上” 。经统计,将不同年龄阶段脑卒中病发者人数代入 () 式, 得到不同年龄阶段脑卒中病发者比例,见图。 (程序见附录)40%30%20%10%0%40以下40-5050-6060-7070-8080以上34.06%23.19%12.88%1.75%4.73%23.39%图 不同年龄段发病人群比例图由图可以看出在岁以下的人口中脑卒中病发的人数
10、比例较小, 之间脑卒中的比例最为严重,岁以上的人脑卒中较为严重,所以高龄的人是发生脑卒中的高危人群,我们应当高度关注。) )单因素方差分析单因素方差分析根据图结果,剔除“岁以下”和“”年龄段,对其余个年龄段进行单因素方差分析,逐月统计不同年龄段发病人群人数, 考察在相同进度点上不同年龄段发病人群人数是否 有显 著差 异, 给定显 著性水平 0.05,分 析结果 为F 45.6,对 应的p 0.0000 0.05(见图) ,所以脑卒中不同年龄段发病人群有显著差异(程序见附录(和))。图 不同年龄段发病人群的单因素方差分析结果不同职业发病人群的差异性分析)简单分析)简单分析不同职业发病比例为Nx3
11、i3i,i 1,2,.,9()N其中,i 1,2,3,4,5,6,7,8,9分别表示“农民” 、 “工人” 、 “退休人员” 、 “教师” 、 “渔民” 、 “医务人员” 、 “职工” 、 “离退人员” 、 “其它职业” 。经统计,不同职业脑卒中病发者的比例,见图。 (程序见附录)60%48.06%50%40%29.37%30%20%7.28%10.70%10%0.36%0.10%0.14%1.19%2.80%0%农民工人教师渔民退休人员医务人员职工离退人员其他职业图不同职业病发者比例由图得出农民、工人、退休人员、其他职业的人员患脑卒中的比例偏高,说明了职业也是患脑卒中的重要因素。) )单因素
12、方差分析单因素方差分析根据图结果,对农民、工人、退休人员进行单因素方差分析,给定显著性水平 0.05,分析结果为F 95.36,对应的p 0.0000 0.05(见图) ,所以脑卒中不同年龄段发病人群有显著差异(程序见附录(和))。图 不同年龄段发病人群的单因素方差分析结果不同月份发病者的差异性分析)简单分析)简单分析定义季节指数为Sx4i4i,i 1,2,.,12()S其中,S4i为第i月的平均人数,S为个月的月平均人数。经统计,不同月份脑卒中病发者的比例,见图。 (程序见附录)1.210.80.60.40.201月2月3月4月5月6月7月8月9月10月11月12月系列10.70930.88
13、041.01440.99181.10121.03381.11891.03461.03151.03331.00991.0409图年年各月季节指数由图看出在五、六、七月份为脑卒中高发期,一、二月为低发期。发病率与气压、气温、相对湿度间的关系分析(问题)由于题目提供了环境因素(气压、温度和湿度)的个变量,根据假设),这个变量间具有明显的显著相关关系,所以必须做降维处理,把个变量整合成互不相关的少数几个变量,然后再寻找发病率与这少数几个变量的关系式。 这需要进行主成分分析。主成分分析法)基本原理基本原理主成分分析是把多个变量转化为少数几个新综合变量的一种多元统计方法,其基本思想就是在保留原始变量尽可能
14、多的信息的前提下达到降维的追求, 从而简化问题的复杂性并抓住问题的主要矛盾.其手段是将原来众多的具有一定相关性的变量重新组合成新的少数几个相互无关的综合变量(也叫抽象变量) ,来代替原来变量,这些新的综合变量称之为主成分.一般地说,利用主成分分析得到的主成分与原来的变量之间有如下基本关系: ()每一个主成分都是各原始变量的线性组合.()主成分的数目大大少于原始变量的数目.()主成分保留了原始变量的绝大多数信息.()主成分之间互不相关.据此我们建立数学模型.) )数学模型数学模型在一个统计问题中,假设我们收集到n个样品,每个样品观测到p个变量(记为x1,x2,xp,为简单起见,可以设xi均值为,
15、方差为,(1i p) ,构成一个n p阶的样本原始资料阵X xijnp.主成分分析的追求在于利用p个原始变量(x1,x2,xp)构造少数几个新的综合变量,使得新变量为原始变量的线性组合,新变量互不相关,新变量包含p个原始变量的绝大部分信息.这样定义x1,x2,xp为原始变量,y1, y2, ym(m p)为新的综合变量指标,每一个新综合变量指标是p个原始变量的线性组合:y1 a11x1a12x2a1pxpy2 a21x1a22x2a2pxp ()y a x ax axm1 1m22mppm同时要求满足以下几个条件: ()yi与yj相互无关。 ()y1是x1,x2,性组合中方差最大者。y2是y1
16、与不相关的x1,x2, ym是z1,z2,zm1分别都不相关的x1,x2,xp的一切线,xp的所有线性组合中方差最大者。,xp的所有线性组合中方差最大者.则新变量y1, y2, ym分别称为原变量x1,x2,xp的第一、第二、第m主成分., p)在从以上的分析可以看出,主成分分析的实质就是确定原来变量xj( j 1,2,诸主成分yi(i 1,2,m)上的系数aij(i 1,2,m;j 1,2,p ).从数学上可以证明,他们分别是p个原始变量(x1,x2,xp)相关矩阵的前m个具有较大特征值所对应的特征向量,而各个新综合变量yi的方差var(yi)恰好是相应的特征值i.各主成分的方差贡献大小按特
17、征根顺序排列, 是依次递减的, 即12p 0.其几何意义是:主成分分析相当于对原坐标轴做一次旋转变换, 使得新坐标系的第轴对应于数据变易的最大方向,第轴与第轴正交,且对应于数据变易的第二大方向,依次类推.) )基本步骤基本步骤()确定分析变量,收集原始数据。设原始数据矩阵为X (xij)np其中xij表示第i个样品(对象)在第j个变量上的取值。()在进行主成分分析之前,要检验该样本矩阵是否适合于主成分分析检验是检验变量之间偏相关关系的统计量, 用于检验变量间的偏相关系数是否过小. 统计量越接近于,说明各变量间的偏相关系数越大,统计量大于,效果最好。如果统计量小于,则不适合于做主成分分析球形检验
18、是检验相关矩阵是否是单位矩阵, 即各变量是否各自独立.()对原始数据进行标准化,即令x *ijxij xjsj()其中xj,sj分别为第j列元素的样本均值和样本标准差,即1n1nxjxij,sj(xij xj)2ni1n1i1*则X* (xij)np为标准化的样本资料库.()由标准化后的数据矩阵求协方差矩阵,或者由原始数据矩阵求相关系数矩阵R.这两种方法结果相等.本文采用直接计算原始数据的相关矩阵的方法 (对于数量级差别较大或者有量纲的数据宜适用).设原始数据X的相关系数矩阵为r11r12.r1prr.r21222p()R .rr.rnpn1n2rij(i, j 1,2, p)为原变量xi与x
19、j的相关系数,rij rji,其计算公式为rij(xk1nki xi)(xkj xj)n(xk1n()ki xi)2(xkj xj)2k1()计算R的特征根和特征向量。根据特征方程E R 0得R的特征根为i(i 1,2,., p),将特征根按照从大到小的顺序排列,排列后的特征根不妨仍然表示为12.p 0.同时可得对应的特征向量u1,u2,.,up,将他们标准正交化,u1,u2,.,up称为主轴.()计算所有变量的方差贡献率及累计方差贡献率。i的方差贡献率为eiii1pi 1,2, p()ii的累计方差贡献率为Eik1pi1iki 1,2, p, k 1,2,.,m,m p()i()确定主成分的
20、数目m. 方法有:一般取累计贡献率达的主成分。选用所有i1的主成分。 累计特征值乘积大于的主成分。 画出特征值变化曲线,以转折点位置为标准判断.本文采用累计贡献率达的主成分.()确定主成分函数表达式模型. 设m个主成分对应的特征向量分别为A1、A2、.Am,其中Aj a1ja2 j.ap j,ak j表示Aj的第k行的元素,则第j个T主成分yj的函数表达式为 x1x2TyjAj a . 1jxpa2 j x1px2.ap jak jxk() . k1xp()提炼主成分yj的抽象意义.由xk与yj的相关系数bk j的大小可以确定yj主要与哪几个变量显著相关,然后根据这几个变量的实际意义提炼yj的
21、抽象意义.()检验主成分模型.根据n个样本的m个主成分的函数值,通过计算m个主成分y1, y2,., ym的相关系数就可以检验m个主成分是否线性无关.如果两个主成分的相关系数为,则说明这两个主成分线性无关,模型有效。否则线性相关,模型无效.()求主成分函数值。将各样本标准化数据xk代入() ,可以求得各样本的第j个主成分yj的函数值.) )模型求解模型求解()收集原始数据矩阵X.本文选取了某地区的月平均气压的平均值、月最高气压的平均值、月最低气压的平均值、月平均气温的平均值、月最高气温的平均值、月平均气压的平均值项指标,并分别记为x1,x2x8.每个指标有个数据(见附件) 。使用软件进行求解(
22、见附录) 。()将原始数据标准化, (内部计算).()求原始数据的相关系数矩阵R,如图所示.图 相关系数矩阵图因子分析检验图从图看出,表格的第一行为检验变量间偏相关程度的统计量,其值在之上才适合做主成分分析,效果显著,如果小于,效果不显著,不适合做主成分分析。下面的三行为球形检验的结果,球形检验原假设的变量是不相关的, 显然只有拒绝原假设的情况下数据才适合做因子分析。本例中值为,球形检验显著,两个条件都满足,变量间相关程度大,适合做因子分析。()计算矩阵R的特征根、各因子的方差贡献率及累计方差贡献率,并确定主成分的个数.如图所示。图R特征值及其累计方差贡献率从图中可以看出,第一、第二主成分对方
23、差的累计贡献率达到,它们分别对应着原样本数据点数据变异的最大、次大方向,是原变量系统的一个最佳整合,从而我们可以以的精度将变量的有效维数从维降至维.因此可以将前个因子作为主因子.()确定主成分函数表达式模型,因子得分系数矩阵如图所示.图因子得分系数矩阵设个主成分分别为y1, y2,则建立模型为y1 0.184x10.183x20.185x30.175x40.186x50.164x60.096x70.121x8()y2 0.048x10.042x20.057x30.020 x40.055x50.015x60.536x70.567x8其中x1,x2,x8.均为原变量经过均值为,方差为标准化后的变量
24、.() 对主成分y1, y2的意义进行解释。 图给出了原变量与第、 第主成分的相关系数.图 旋转后的因子载荷矩阵第一主成分y1, 与原变量x1(平均气压的平均值)、x2(最高气压的平均值)x3(最低气压的平均值) 、x6(最低气温的平均值)的相关系数的绝对值都超过了,因此它是一个反映气温和气压的综合因子,我们称之为气压温度因子.第二主成分y2,与原变量x7(月平均相对湿度的平均值)的相关系数为、x8(月最低相对湿度的平均值)的相关系数为,其余的都不超过,因此它是一个反映相对湿度的因子,称为湿度因子.()计算个主成分的函数值.将个经过标准化的数据xi*代入模型yj, 可以得到个地区的主成分yj的
25、函数值, 结果如表所示.表个月对应的主成分函数值序号序号()检验主成分模型.由于主成分分析的个条件中的前个(每一个主成分都是各原始变量的线性组合。主成分的数目大大少于原始变量的数目。主成分保留了原始变量的绝大多数信息) ,只要检验个主成分是否相关即可.由步骤()计算的个主成分的得分矩阵Y yij482,求矩阵Y的协方差矩阵如图所示.图 因子得分的协方差矩阵从图可以看出,主成分得分的协方差矩阵为单位矩阵,说明提取的个主成分是互不相关的.满足假设的条件,模型和结果有效.多元非线性回归分析将个月的发病率作为因变量,记作z,将发病率的个数据填入表中。下面寻找发病率z与主成分y1, y2的关系式,这需要
26、使用多元非线性回归分析方法。经过反复试验探索,找到的非线性回归模型为a ya4y2az expa1y1a2y2315a6()y1 y2y1(1 y2)y1其中,a1 0.1281,a2 0.0472,a3 0.0273,a4 0.0021,a5 0.0407,a6 7.0361。模型检验的p 0.0399 0.05,说明模型有效。平均绝对相对误差为。结果分析)从非线性回归模型()可以得到以下结论:()由a1 0可得,发病率与气压温度因子具有正相关性。()由a2 0可得,发病率与湿度因子具有负相关性。()由a1 a2可得,气压温度因子比湿度因子对于发病率的影响显著。)从主成分模型()可以得到以下
27、结论:由第个方程可知:()由x1,x2,x3的系数为负值可得,气压温度因子与月平均气压、月平均最高气压、月平均最低气压具有负相关性。()由x4,x5,x6的系数为正值可得,气压温度因子与月平均温度、月平均最高温度、月平均最低温度具有正相关性。()由x7,x8的系数为负值可得,气压温度因子与月平均相对湿度、月平均最低相对湿度具有负相关性。由第个方程可知:()由x1,x2,x3的系数为正值可得,湿度因子与月平均气压、月平均最高气压、月平均最低气压具有正相关性。()由x4 0,x5 0,x6 0可得,湿度因子与月平均温度、月平均最高温度成负相关性,与月平均最低温度具有正相关性。()由x7,x8的系数
28、为正值可得,湿度因子与月平均相对湿度、月平均最低相对湿度具有正相关性。高危人群预警分析(问题)第一步预测年的气象状况,然后预测未来年的高危人群的发病率和发病进度, 最后提出预警和干预措施。未来年气象预测)气压、温度状况预测)气压、温度状况预测观察月平均气压x1、月平均最高气压x2、月平均最低气压x3、月平均温度x4、月平均最高温度x5,月平均最低温度x6的历史数据,发现随进度做周期性变化,于是建立余弦函数模型x Acos(t ) B,利用过去个月的历史数据进行参数估计,然后使用年的个数据进行预测,评估误差并检验模型的可靠性。 最后预测出年的个月的数据。建模结果见表.(程序见附录) 。年个月的预
29、测结果见表.表 模型参数估计结果变量表达式参数拟合值平均相对误差x1x Acos(t ) BA 10.6, 5, 1,B 1015.5A 11,2, 5, 4,B 1017.8x2x Acos(t ) Bx3x Acos(t ) BA 10,1, 5, 3,B 1013.2x4A 12.1375, 0.5211,x Acos(t ) B 2.1851,B 16.8618A 12.0959, 0.5198,x Acos(t ) B 6.8425,B 21.0561x5x6x Acos(t ) BA 12.2819, 0.5224, 0.6683,B 13.5482表 年个月的气压、温度预测值月份
30、平均温度平均压力最高压力最低压力最高温度最低温度月份平均温度平均压力最高压力最低压力最高温度最低温度)湿度状况预测)湿度状况预测观察月平均湿度x7、 月平均最低湿度的历史数据x8, 发现它们随进度做平稳性波动,于是建立马尔克夫模型,利用过去个月的历史数据进行建模,然后预测出第个数据。采用“新陈代谢”思想,把第个数据加入建模序列,并同时去掉最老的第个数据,保持数据“等维” ,建模并预测出第个数据,如此滚动预测,直至预测出年的个数据,并做误差分析,检验模型的可靠性。最后预测出年的个数据。()自相关系数原始序列X(0)=X(0)(1),X(0)(2),., X(0)( n)的各阶自相关系数反映已知数
31、据对未来数据的影响程度. 各阶自相关系数为nwrwXk1(0)(0)(0)(k) X(0) X(k w) XXk1n(0)(k) X(0)2()式中,X(0)1n(0)=X(k)()nk1对各阶自相关系数归一化得,w=rwrw1t,w 1,2,.,t()ww可作为各阶步长的马尔柯夫链权重,t是按预测需要计算的最大阶数,一般取rw 0.3.根据rw 0.3可以确定转移步数w.()加权马尔柯夫模型()加权马尔柯夫模型状态划分。设划分的m个湿度区间为E1a11,a21,Eia1i,a2i,i 2,3,.,m 1Ema1m,a2m其中,a11尽可能小,a2m尽可能大.,如果(k)Ei,i 1,2,.,
32、 m则表明第k年的相对误差处于第i种状态.(w)状态转移概率矩阵的构造。设w步转移概率为pij,记:(w)mijp(w)ij=Mi,i, j 1,2,.,m()(w)其中,mij表示状态Ei经过w步转移到状态Ej的次数,Mi为状态Ei出现的次数.由于数据序列最后的状态转向不确定,故计数Mi时要去掉数据序列中最末的w个数据(也就是只考虑前面的n w个数据).(w)由pij构成的矩阵称为w步转移概率矩阵,记作w)p1(m(w)p2(w)m()R(w)(w)pm.p2mm已知每一步的概率转移矩阵和每一步的初始状态,则马尔柯夫链就可以确定.预测值计算(w) p11(w)p21.(w)pm1(w)p12
33、.(w)p22.选取距离预测年最近的t(t m)个年份, 按照距离预测年由近到远, 转移步数w分别为1,2,.,t,以这几年的相对误差所对应的状态为初始状态,不妨设第1,2,.,t年所(1)(2),E2,., Et(t),其中,w1,2,.,m.例如,当2 5时,对应的初始状态分别为E1(2)(2)(w)E2=E5,说明距离预测年第年的状态是第状态.在转移步数w对应的转移矩阵R(w)(w)(w)(w)(w)中,取起始状态Ew.,pwm,从而组成新的概率矩所对应的行向量pw=pw1,pw2,阵(1) p11(2)p21R .(t)pt1(1)p12.(2)p22.(1)p1m(2)p2 m())
34、pt(tmt)pt(2.将矩阵R加权得(1)(1)(1)1p111p12.1p1m(2)(2)(2)pp.p22222 m()R221.(t)(t)(t)pp.ptt2ttmtt1将矩阵R按列求和得ttt(w)(w)(w)p p1, p2,., pm=wpw1,wpw2,.,wpwm()w1w1w1找出向量p的最大分量得pM maxp1, p2,., pm,M 1,2,.,m()分量pM所对应的状态EM就是预测年的状态,则该年度的预测值为Ma1Ma2M()2()计算过程和结果以预测年第月的数据为例。利用、 、年的个月的历史数据进行建模。自相关系数。以根据() 、 () 、 ()式计算可得各阶的
35、自相关系数,确定最大滞后阶数w 2.各阶自相关系数及权重见表.表自相关系数及权重wrww划分的种状态区间,见表.表 各个状态区间状态编号状态区间E1)E2)E3)E4)E5)E6构造转移概率矩阵如果有的状态不能从统计表中得到转移概率, 则假定它未来转移到各个状态的概1率都相等,即都等于.根据()可得步和步内的转移概率矩阵分别见表和表.m表步转移概率矩阵R(1)表步转移概率矩阵R(2)组成预测年份的新转移概率矩阵.选择离预测年最近的个年份,转移步数分别为w1,2,根据()式得预测年的转移概率矩阵R37,见表.表月份状态步长权重预测年的转移概率矩阵R37概率来源R(1)R(2)加权求和确定预测年份
36、的状态确定预测年份的状态. .预测年的状态向量的最大分量值为,对应的状态为第状态,即第个月的湿度将处于第状态,湿度.将第个月的湿度值放入序列中,同时去掉第个月的湿度数据,重新构建马尔柯夫链,得第个月的湿度。以此类推,可得年个月的湿度值,见 表.平均绝对相对误差为,可靠性高.表 年湿度预测月份实际x77模拟x绝对相对误差表 年湿度预测月份x7x8未来年个月的发病人数预测将预测得到的年个月的气象数据代入主成分模型()和多元非线性回归模型() ,计算得到年发病率的发展趋势,如图所示。0.60.50.40.30.20.101234567891011122011年月份发病率图年发病率趋势从图可知,年发病
37、率的发展趋势是,月保持平稳态势,从月份开始呈现上升态势,至、 、月份到达高发期,之后,和月份下降进入低发期。干预措施和建议查阅文献,发现以下信息:)脑卒中,又称中风或脑血管意外,它包括脑出血、蛛网膜下腔出血、脑梗死和短暂性脑缺血发作等急性脑血管病 ,是一组突然起病,以出现思想障碍和局灶性神经功能缺失为共同特征的急性脑血管病。)它具有以下特征:()发病率高;()致残率高;()死亡率高;()复发率高。)它的关键指标为: ()头晕。 ()肢体麻木。 ()暂时性吐字不清或讲话不灵。 ()肢体无力或活动不灵。 ()与平时不同的头痛。 ()不明原因突然跌倒或晕倒。 ()短暂思想丧失或个性和智力的突然变化。
38、 ()全身明显乏力,肢体软弱无力。 ()恶心呕吐或血压波动。脑卒中病人大部分是“三高” 、有家族病史与前科老年人。建议措施: ()卫生组织在年的秋季前做好迎接高发病人的准备。 ()预防为主,多锻炼,多吃蔬菜,不吸烟,不喝酒,防“三高” 。六、需要进一步研究的问题六、需要进一步研究的问题对高危人群如男性人群、 岁以上人群、 农民群体进行预测, 做好预警和干预。七、七、模型评价模型评价模型优点:)主要因素并进行了定量分析,模型缺点:)当考虑定性相关因素较多时,八、参考文献周晓平,杨进.脑卒中发生时气节规律及其气象医学原理探讨.中医杂志,年月,第卷第期.谢文龙,尚涛统计分析与数据挖掘.北京:北京电子
39、工业出版社,韩中庚.数学建模方法与应用.北京:高等教育出版社,(重印).陈在余,陶应虎.统计学原理与实务.北京:清华大学出版社,复发高危人群,低温危害高温危害九、附录附录.统计发病人群的性别比例建立文件:统计发病人群的性别比例(题数据,)读入发病人群信息,行列();(); () () ()()男性病人的人数 ()()女性病人的人数()性别比例附录.方差程序建立文件夹: ()是发病人数信息矩阵,是年份();(); () () () () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); ()
40、 ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()();年*个月的男女发病人数发病人群信息(题数据,)行列();();();();();*矩阵,男女个月的发病人数 () 下面做单因素方差分析附录.统计各阶段发病人群年龄比例建立文件:发病人群信息(题数据,)行列();(); () () () () () () ()()岁以上病发人数 ()();()年龄比率附录、不同职业病发者比例发病人群信息
41、(题数据,)行列();(); () () ()()农民在病发者中的人数 () ()()工人在病发者中的人数 () ()()退休人员在病发者的人数 () ()()教师在病发者的人数 () ()()渔民在病发者中的人数 () ()()医务人员在病发者中的人数 () ()()职工在病发者中的人数 () ()(, ) 。其他职业在病发者中的人数 ()();()不同职业人数比例附录建立文件夹发病人群信息(题数据,)行列();();();();();*矩阵,个职业个月的发病人数 () 下面做单因素方差分析附录、 年年各自月份病发者指标建立文件夹:发病人群信息(题数据,)行列();(); () () ()
42、()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()();年各自月份病发者指标 () () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()();年各自月份病发者指标 () () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()()
43、; () ()(); () ()(); () ()(); () ()(); () ()();年各自月份病发者指标 () () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()(); () ()();年各自月份病发者指标()()季节指数附录主成分分析:设置步骤如下:()打开因子分析.()将要分析的变量移入.()选中“初始解” 、 “相关系数”和“检验和球形检验”.()选中“主成分分析方法” 、 “相关系数矩阵” 、 “未经过旋转的因子解(因子载荷矩阵) ” 、 “碎石图” 、 “变量提取数目”.() (如果需要旋转的话)选中“方差最大化旋转方式” 、 “旋转解” 、 “因子载荷图”.点击“”就可以输出计算结果.附录程序:;()*()*()(),);(,);()*()*()();(,)()*()*()();()输出相对误差()输出绝对相对误差()输出平均绝对相对误差()输出最大绝对相对误差;()*()*()()