《《基因组医学信息技术》教学大纲(本科).pdf》由会员分享,可在线阅读,更多相关《《基因组医学信息技术》教学大纲(本科).pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、105 基因组医学信息技术 一、课程简介 随着人类基因组计划(HGP)在世界范围内的实施,产生了大量的基因组信息,分析这些信息是人类基因组研究必不可少的重要内容。生物信息学在基因组数据分析中起着非常重要的作用,涉及基因组信息的获取、处理、存储、分配、分析和解释等所有方面,以达到理解这些生物大分子信息的生物学意义的交叉学科,并服务于人类健康事业药物开发、基因诊断、治疗等。生物信息学在生命科学与计算机、数学之间的关系,充分利用各种方法和手段从海量的生物学数据中发现生物学知识。生物信息学主要讲授新一代测序测序技术的原理和方法、测序数据分析方法及应用、核酸序列比对、基因的功能注释与富集、复杂疾病的系统
2、生物学研究及 ncRNA 的功能、ncRNA 与复杂疾病的关系,也就是“读懂”人类基因组。该课程内容需要前期的基础课、专业基础课程知识作为铺垫,充分体现了生物信息学在基因组领域的发展,是生物技术专业必不可少的专业课之一。通过本课程学习,使学生熟悉网上的各种基因组信息资源,掌握基因组的相关基础知识、基因组信息学的分析流程、基因的功能及其与复杂疾病的关系,具备处理新一代测序数据、基因功能分析、ncRNA 靶基因识别和优化疾病基因等基因组信息学的基本能力。二、理论教学内容 1.生物信息学导论 掌握内容:生物信息学概念及其主要特征。了解内容:重要的分子生物学知识、基因组功能原件和基因表达调控机理;生物
3、信息学的主要研究范畴及其在复杂疾病研究中的应用。2.生物序列资源 掌握内容:NCBI的基本功能,Gene Bank、Entrez Gene数据库的重要资源的获取;UCSC基因组浏览器的使用方法;Esemble Mart数据存储与下载平台中的数据资源及其下载方式;Uniprot数据库资源与数据下载;mirBase和Encode数据库中的非编码基因序列特征和下载方式。了解内容:其他数据资源的获取和应用价值;各网络资源和数据库的功能和应用领域;发展趋势及其对生物医学的影响。3.序列比对技术 掌握内容:序列比对的概念;双序列比对全局比对和局部比对算法;BLAST和BLAT比对的应用,及其参数设置方法。
4、了解内容:全局比对和局部比对意义;多序列比对算法;序列同源与序列相似、垂直同源和水平同源的区别;常用数据库搜索工具的参数的意义;全基因组比对的意义。4.序列特征分析 掌握内容:序列motif的概念;序列motif的定义;基因识别方法;主要的蛋白质序列特征;RNA序列与二级结构预测;新一代测序数据的预处理。了解内容:454测序技术原理;短序列数据处理的基本流程和方法;短序列数据处理的基本流程和方法;人类基因组序列相关数据资源;新一代测序技术在疾病研究中的应用现状。5.人类变异组学与复杂疾病分析 掌握内容:疾病分子遗传特征;统计遗传与基因定位技术的基本概念;人类遗传变异网络资源;疾病风险基因、SN
5、P联识别方法;复杂疾病关联分析的的软件实现与应用;新一代测序数据识别SNV的基本方法;罕见变异的一般分析方法和软件实现。了解内容:以遗传变异为分子标志物进行疾病分析的原理和基本假设,及其应用;基因组范围 106 关联分析方法、应用和资源;多重检验校正原理;疾病靶向测序识别技术及其应用;系统遗传学和数量遗传学分析方法。6.复杂疾病的转录调控与表观遗传分析 掌握内容:转录因子结合位点的计算预测工具;CHIP-Seq和CHIP-chip技术原理;表观遗传学基本概念、类型;CpG岛识别;差异甲基化分析方法;组蛋白修饰的命名、类型,疾病疾病下组蛋白修饰的一般方法。了解内容:CHIP-Seq和CHIP-c
6、hip数据分析的算法原理;转录调控常用网络资源;通过CHIP-Seq数据预测转录结合位点;表观遗传因子对基因功能和表型的影响及其遗传机制;组蛋白修饰对基因表达的影响机制,组蛋白修饰分析的算法原理,组蛋白修饰的可遗传机制。7.基因表达分析技术与复杂疾病研究 掌握内容:基因芯片数据获取与分析方法;RNA-seq技术及其基本分析方法。了解内容:常用的基因表达数据资源;基因芯片技术流程,基因表达数据的统计学分析方法;基因表达数据的机器学习分析方法与原理。8.非编码RNA与人类复杂疾病分析技术 掌握内容:基于测序数据非编码RNA软件识别方法;microRNA表达与疾病相关性分析。了解内容:非编码RNA类
7、别与作用机制;非编码RNA识别的算法原理;lncRNA与复杂疾病研究现状。9.基因注释与功能分类 掌握内容:GO和KEGG等基因注释数据库;基因集功能富集的原理;基因及其产物的功能预测方法。了解内容:其他功能富集分析的算法原理;功能注释在功能基因组学中的意义。10.生物分子网络与通路分析方法 掌握内容:分子网络的基本概念和网络可视化技术;蛋白质互作网络、调控网络的基本概念;分子网络的测度;子通路的划分与分析方法。了解内容:网络分析方法的研究意义;子通路在研究中的应用;疾病-基因网络研究意义;疾病关联子网络分析技术。三、实验教学内容 1.转录组的生物信息学分析实例 基本内容:三大核酸序列数据库的
8、搜索方法、蛋白质数据库的搜索方法;熟悉Clustal Omega程序;启动子序列motif的识别。基本要求:在GenBank搜索目标序列;利用Clustal Omega程序在本地实现多序列比对。利用工具MEME或编程实现序列motif识别。2.新一代测序数据分析 基本内容:新一代测序数据质量控制分析方法介绍;FastQ及BAM数据格式介绍;Linux环境下分析新一代测序的基本方法。基本要求:熟悉FastQC软件的使用;利用MACS进行ChIP-seq数据分析。3.ncRNA和靶基因 基本内容:熟悉miRBase、GENCODE数据库、掌握miRNA靶基因的获取方法、掌握lncRNA靶基因的获取
9、方法。基本要求:会使用miRBase、GENCODE数据库下载ncRNA的注释信息、能够获取给定lncRNA或miRNA的靶基因。4.ncRNA和复杂疾病 基本内容:复杂疾病基因(miRNA、lncRNA和编码基因)数据库的使用、基于表达谱识别疾病 107 相关miRNA、lncRNA。基本要求:能通过HMDD、lnc2disease、OMIM等数据库获取特定疾病的、lncRNA和编码基因;编写程序实现基于表达谱疾病相关miRNA、lncRNA的识别。5.基因注释与功能分类 基本内容:超几何检验与DAVID方法用于基因富集分析的结果比较。基本要求:熟悉DAVID软件的使用;利用R语言进行基因功
10、能富集分析。6.生物分子网络 基本内容:利用R语言构建生物分子网络;使用cytoscape进行网络可视化展示。基本要求:熟悉cytoscape软件的使用;利用R语言进行网络构建及拓扑性质分析。四、参考资料 生物信息学第2版.李霞主编.人民卫生出版社.2015年6月出版 五、学时分配 序号 教学内容 参考学时 总学时 理论学时 实验学时 1 生物信息学导论 4 4 0 2 生物序列资源 6 4 2 3 序列比对技术 6 4 2 4 序列特征分析 4 4 0 5 人类变异组学与复杂疾病分析 6 4 2 6 复杂疾病的转录调控与表观遗传分析 4 4 0 7 基因表达分析技术与复杂疾病研究 8 4 4 8 非编码 RNA 与人类复杂疾病分析技术 8 4 4 9 基因注释与功能分类 6 4 2 10 生物分子网络与通路分析方法 8 4 4 合计 60 40 20