2022年数学建模在生物信息学中应用研究报告 .pdf

上传人:Che****ry 文档编号:25438632 上传时间:2022-07-11 格式:PDF 页数:9 大小:88.72KB
返回 下载 相关 举报
2022年数学建模在生物信息学中应用研究报告 .pdf_第1页
第1页 / 共9页
2022年数学建模在生物信息学中应用研究报告 .pdf_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《2022年数学建模在生物信息学中应用研究报告 .pdf》由会员分享,可在线阅读,更多相关《2022年数学建模在生物信息学中应用研究报告 .pdf(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、个人资料整理仅限学习使用目录目 录 i摘 要 ii第一部分数学建模11 数学建模的介绍1 2 数学建模的主要内容1 3 数学建模的流程2 4 数学建模的主要算法2 5 数学建模的软件3 第二部分生物信息学31 什么是生物信息学3 2 生物信息学的研究方向3 第三部分生物信息学与数学建模的交叉31 方法和技术的交叉3 1.1 数学统计方法4 1.2 动态规划方法4 1.3 机器学习4 1.4 数据挖掘4 1.5 生物分子的计算机模拟5 2 目的上的相似5 第四部分数学建模在生物信息学中的部分应用5 1运用数学模型的预测5 2运用数学模型的数据分析6 参考文献7精选学习资料 - - - - - -

2、 - - - 名师归纳总结 - - - - - - -第 1 页,共 9 页个人资料整理仅限学习使用数学建模在生物信息学中的应用研究摘要本文首先介绍了数学建模和生物信息学的基础知识,然后分析了数学建模和生物信息学的交叉知识点。分析显示,数学建模和生物信息学不仅在统计方法和数据挖掘等使用方法和技术方面存在交叉知识点,还在目的上具有一定的相似性,即两者都是对大量的数据进行统计和分析,都以解决问题为最终目的。最后,文章重点回顾了数学建模在生物信息学中数据分析和结构预测方面的部分应用。关键词 :数学建模生物信息学应用研究精选学习资料 - - - - - - - - - 名师归纳总结 - - - - -

3、 - -第 2 页,共 9 页个人资料整理仅限学习使用第一部分数学建模1数学建模的介绍从航空航天领域中的火箭发射、武器的自动导航,到企业中该如何配置人力、物力和财力,进而用最小的成本产生最大的利润,再到生活中如何规划自己有限的时间复习期末考试,等等。这都或多或少地运用到了数学建模的知识。数学建模是一个将实际问题用数学的语言、方法,去近似刻画、建立相应数学模型并解决科研、生产和生活中的实际问题的过程。数学建模的问题比较广泛,涉及到多学科知识,它不追求解决方法的天衣无缝,不追求所用数学知识的高深,也不追求理论的严密逻辑,它以解决问题为主要目的。模型的建立,即把错综复杂的实际问题简化、抽象化为具有合

4、理的数学结构的过程。通过调查、收集数据资料,观察和研究实际对象的固有特征和内在规律,抓住问题的主要矛盾,建立起反映实际问题的数量关系,然后利用数学的理论和方法去分折和解决问题。随着科学技术的飞速发展,人们越来越认识到数学的重要性:数学的思考方式具有根本的重要性,数学为组织和构造知识提供了方法,将它用于技术时能使科学家和工程师生产出系统的、能复制的、且可以传播的知识数学对于经济竞争是必不可少的,数学科学是一种关键性的、普遍的、可实行的技术。在当今高科技与计算机技术日新月异且日益普及的社会里,高新技术的发展离不开数学的支持,没有良好的数学素养已无法实现工程技术的创新与突破。2数学建模的主要内容数学

5、建模理论包含统计回归模型、优化模型、图论模型、微分模型和概率模型等【1-3】,如表 1 所示。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 9 页个人资料整理仅限学习使用表 1 数学建模的主要内容统计回归模型运筹与优化模型图论与网络模型微分差分模型概率模型数学挖掘聚类分析层次分析线性回归非线性回归主成分分析时间序列分析数据拟合与插值博弈论线性规划整数规划目标规划动态规划非线性规划多目标决策存贮论模型图论模型最小生成树最大流问题最短路径问题最长路径问题PERT网络图模型最小费用流问题GM模型微分方程模型稳定性模型差分方差模型灰色预测模型

6、偏微分方程模型随机模拟计算机模拟决策论模型排队论模型马氏链模型3数学建模的流程图 1 数学建模的流程34数学建模的主要算法蒙特卡罗算法 该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性。数据处理算法 通常会遇到大量的数据需要数据拟合、参数估计、插值等处理,通常使用Matlab 作为工具。规划算法 遇到线性规划、整数规划、多元规划、二次规划等最优化问精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 9 页个人资料整理仅限学习使用题,可以用数学规划算法来描述,通常使用Lingo 软件实现。

7、图论算法 包括最短路、网络流、二分图等算法。动态规划、回溯搜索、分治算法、分支定界等算法。非经典算法 模拟退火法、神经网络、遗传算法为最优化理论的三大非经典算法。5数学建模的软件数学建模有专用的软件: Matlab 7 , Lingo 8为其中最主要的软件,其他重要的软件有 Mathematice ,S-plus ,SAS等。第二部分生物信息学1什么是生物信息学生物信息学是一门新兴的交叉学科,它使用数学和计算机这两项工具,对日益增长的生物数据进行快速、高效的组织与分析。生物信息学的近期任务是大规模的基因组测序中的信息分析、新基因和新SNP的发现与鉴定、完整基因组的比较研究、大规模基因功能表达谱

8、的分析、生物大分子的结构模拟与药物分析,其远期任务是非编码区信息结构分析、遗传密码起源和生物进化的研究。2 生物信息学的研究方向生物信息学的发展异常迅速,现主要包括DNA序列对比、蛋白质结构对比与预测、编码区的基因识别、序列重叠群(Contigs 装配、基于结构的药物设计、非编码区的分析研究、遗传密码的起源、分子进化与比较基因组学、生物系统的建模和仿真、生物信息学技术方法的研究等几个研究方向【4-6】。第三部分生物信息学与数学建模的交叉生物信息学是利用数学和计算机作为工具,不可避免地与数学建模,这一利用计算机和数学理论解决实际问题的学科,无论在研究方法和技术上,还是在运用目的上均产生一定的交叉

9、。1方法和技术的交叉生物信息学所使用的方法与技术包括数学统计方法、动态规划方法、机器学习精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 9 页个人资料整理仅限学习使用与模式识别技术、数据库技术与数据挖掘、人工神经网络技术、生物分子的计算机模拟等,而这些恰恰是数学建模领域的核心理论与知识。1.1 数学统计方法数据统计、因素分析、多元回归分析是生物学研究必备的工具,而这些是数学建模的统计回归模型中最为基础的知识;隐马尔科夫模型Hidden Markov Models)在序列分析方面有着重要的应用,与隐马尔科夫模型相关的技术是马尔科夫链 Ma

10、rkov Chain),而马尔科夫链模型正是数学建模中针对离散状态按照离散时间的随机转移而建立的模型。总之,生物信息学和数学建模有的第一个共同点是,都有对海量数据进行统计分析的过程。1.2 动态规划方法动态规划 模型应用于蛋白质二级结构类型的预测,把提取出的蛋白质氨基酸的排列信息作为伪氨基酸成分,从而较大的提高了预测的成功率。2008 年邱望仁等9人将 OET-KNN 算法应用于蛋白质二级结构类型的预测,通过LZ 复杂度的算法计算了伪氨基酸的成分,再用 OET-KNN 算法分类预测,从而也较大的提高了预测的成功率。Bader 等10人将 Logistic回归模型用来预测蛋白质之间的生物学关系,

11、这种运用使得通过遗传学和基因表达数据来分析蛋白质数据成为了可能。2006 年精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 9 页个人资料整理仅限学习使用王明会等11人将 Markov 链模型应用于蛋白质可溶性的预测,预测精度普遍好于或接近于神经网络、信息论和支持向量机法的结果,而且该模型的运算复杂度低,耗时也更短。 2006 年张菁晶等12人将隐马尔可夫模型运用于目标基因全基因组的预测,同量高、准确度高并且操作简单,尤其在多结构域蛋白家族的预测上优势明显。 2008 年刘桂霞等13人提出了一种带偏差单元的递归神经网络模型。该模型根据B

12、P算法得出权系数调整规则,使得收敛速度比一般的BP网络更快,对于预测蛋白质关联图有一定的实用价值。2. 运用数学模型的数据分析1997 年 Carr 等14研究了大鼠脊髓的基因活动,通过聚类分析证明具有已知相似功能的基因属于一类。2006 年张文彤等15人综合了聚类方法和进化树分析的优点,通过先聚类将数据拆分,然后根据聚类的类别构建进化树,这种方法可以很好地在大样本数据中应用,并以甲型流感病毒的H3A1序列作为实例,构建拼接出了完整的进化树结果。2006 年徐丽等16人针对 Viterbi算法和 Baum-Welch算法在隐马尔可夫模型:48-528 林卫中 , 肖绚 . 基于GM(1,1模型

13、的蛋白质二级结构类型预测. 计算机工程与应用, 2007, 43(34: 41-459 邱望仁 , 肖绚 , 林卫中 . 基于OET-KNN算法的蛋白质二级结构类型预测. 计算机工程与应用 , 2008, 44(29: 204-21010 Bader JS,Chaudhuri A,Rothberg JM,et al.Gaining confidence in high-throughput protein interaction network. Nat Biotechnol,2004,22: 78-8511 王明会 , 李 骜, 王娴等 . Markov链模型在蛋白质可溶性预测中的应用. 生

14、物医学工程学杂志 , 2006, 23(5: 1109-111312 张 菁 晶 , 冯晶 , 朱 英 国 . 全 基 因 组 预 测 目 标 基 因 的 新 方 法 及 其 应 用 . 遗传.2006,28(10:1299-130513 刘桂霞 , 于哲舟 , 周春光 . 基于带偏差递归神经网络蛋白质关联图的预测. 吉林大学学报 ( 理学版 , 2008, 46(2: 265-27014 Carr DB, Somogyi R, Michaels G. Templates for looking at gene expression clustering. Statistical Comput

15、ing & Statistical Graphics Newsletter, 1997,8:20-2915 张 文 彤 , 姜 庆 五 . 聚 类 技 术 在 大 样 本 序 列 进 化 树 分 析 中 的 应 用 . 中 国 卫 生 统计.2006,23(5:393-39616 徐丽 , 康瑞华 .基于遗传算法的HMM 参数估计 . 湖北工业大学学报. 2006,21(4:68-7117 周晓彦 , 郑文明 . 基于模糊核判别分析的基因表达数据分析方法. 华中科技大学学报( 自然科学版 , 2007, 35(I: 173-17618 刘 万 霖 , 李栋 , 朱 云 平 等 . 基 于 微 阵 列 数 据 构 建 基 因 调 控 网 络 . 遗传,2007,29(12:1434-1442精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 9 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁