《《基因组医学信息技术》教学大纲(本科).docx》由会员分享,可在线阅读,更多相关《《基因组医学信息技术》教学大纲(本科).docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基因组医学信息技术一、课程简介随着人类基因组计划(HGP)在世界范围内的实施,产生了大量的基因组信息,分析这些信息 是人类基因组研究必不可少的重要内容。生物信息学在基因组数据分析中起着非常重要的作用,涉 及基因组信息的获取、处理、存储,分配、分析和解释等所有方面,以到达理解这些生物大分子信 息的生物学意义的交叉学科,并服务于人类健康事业药物开发、基因诊断、治疗等。生物信息 学在生命科学与计算机、数学之间的关系,充分利用各种方法和手段从海量的生物学数据中发现生 物学知识。生物信息学主要讲授新一代测序测序技术的原理和方法、测序数据分析方法及应用、核 酸序列比对、基因的功能注释与富集、复杂疾病的系统
2、生物学研究及ncRNA的功能、ncRNA与复 杂疾病的关系,也就是“读懂”人类基因组。该课程内容需要前期的基础课、专业基础课程知识作为铺垫,充分表达了生物信息学在基因组 领域的开展,是生物技术专业必不可少的专业课之一。通过本课程学习,使学生熟悉网上的各种基 因组信息资源,掌握基因组的相关基础知识、基因组信息学的分析流程、基因的功能及其与复杂疾 病的关系,具备处理新一代测序数据、基因功能分析、ncRNA靶基因识别和优化疾病基因等基因组 信息学的基本能力。二、理论教学内容1 .生物信息学导论掌握内容:生物信息学概念及其主要特征。了解内容:重要的分子生物学知识、基因组功能原件和基因表达调控机理;生物
3、信息学的主要 研究范畴及其在复杂疾病研究中的应用。2 .生物序列资源掌握内容:NCBI的基本功能,Gene Bank Entrez Gene数据库的重要资源的获取;UCSC基因组 浏览器的使用方法;Esemble Mart数据存储与下载平台中的数据资源及其下载方式;Uniprot数据库 资源与数据下载;mirBase和Encode数据库中的非编码基因序列特征和下载方式。了解内容:其他数据资源的获取和应用价值;各网络资源和数据库的功能和应用领域;开展趋 势及其对生物医学的影响。3 .序列比对技术掌握内容:序列比对的概念;双序列比对全局比对和局部比对算法;BLAST和BLAT比对的应 用,及其参数
4、设置方法。了解内容:全局比对和局部比对意义;多序列比对算法;序列同源与序列相似、垂直同源和水 平同源的区别;常用数据库搜索工具的参数的意义;全基因组比对的意义。4 .序列特征分析掌握内容:序列motif的概念;序列motif的定义;基因识别方法;主要的蛋白质序列特征;RNA 序列与二级结构预测;新一代测序数据的预处理。了解内容:454测序技术原理;短序列数据处理的基本流程和方法;短序列数据处理的基本流程 和方法:人类基因组序列相关数据资源;新一代测序技术在疾病研究中的应用现状。5 .人类变异组学与复杂疾病分析掌握内容:疾病分子遗传特征;统计遗传与基因定位技术的基本概念;人类遗传变异网络资源;
5、疾病风险基因、SNP联识别方法;复杂疾病关联分析的的软件实现与应用;新一代测序数据识别SNV 的基本方法;罕见变异的一般分析方法和软件实现。了解内容:以遗传变异为分子标志物进行疾病分析的原理和基本假设,及其应用;基因组范围105 关联分析方法、应用和资源;多重检验校正原理;疾病靶向测序识别技术及其应用;系统遗传学和 数量遗传学分析方法。6 .复杂疾病的转录调控与表观遗传分析掌握内容:转录因子结合位点的计算预测工具;CHIP-Seq和CHIP-chip技术原理;表观遗传学基 本概念、类型;CpG岛识别;差异甲基化分析方法;组蛋白修饰的命名、类型,疾病疾病下组蛋白 修饰的一般方法。了解内容:CHI
6、P-Seq和CHIP-chip数据分析的算法原理;转录调控常用网络资源;通过CHIP-Seq 数据预测转录结合位点;表观遗传因子对基因功能和表型的影响及其遗传机制;组蛋白修饰对基因 表达的影响机制,组蛋白修饰分析的算法原理,组蛋白修饰的可遗传机制。7 .基因表达分析技术与复杂疾病研究掌握内容:基因芯片数据获取与分析方法;RNA-seq技术及其基本分析方法。了解内容:常用的基因表达数据资源;基因芯片技术流程,基因表达数据的统计学分析方法; 基因表达数据的机器学习分析方法与原理。8 .非编码RNA与人类复杂疾病分析技术掌握内容:基于测序数据非编码RNA软件识别方法;microRNA表达与疾病相关性
7、分析。了解内容:非编码RNA类别与作用机制;非编码RNA识别的算法原理;IncRNA与复杂疾病研究 现状。9 .基因注释与功能分类掌握内容:GO和KEGG等基因注释数据库;基因集功能富集的原理;基因及其产物的功能预测 方法。了解内容:其他功能富集分析的算法原理;功能注释在功能基因组学中的意义。10 .生物分子网络与通路分析方法掌握内容:分子网络的基本概念和网络可视化技术;蛋白质互作网络、调控网络的基本概念; 分子网络的测度;子通路的划分与分析方法。了解内容:网络分析方法的研究意义;子通路在研究中的应用;疾病-基因网络研究意义;疾病 关联子网络分析技术。三、实验教学内容1 .转录组的生物信息学分
8、析实例基本内容:三大核酸序列数据库的搜索方法、蛋白质数据库的搜索方法;熟悉Clustal Omega程 序;启动子序列motif的识别。基本要求:在GenBank搜索目标序列;利用Clustal Omega程序在本地实现多序列比对。利用工 具MEME或编程实现序列motif识别。2 ,新一代测序数据分析基本内容:新一代测序数据质量控制分析方法介绍;FastQ及BAM数据格式介绍;Linux环境下 分析新一代测序的基本方法。基本要求:熟悉FastQC软件的使用;利用MACS进行ChlP-seq数据分析。3 .ncRNA和靶基因基本内容:熟悉miRBase、GENCODE数据库、掌握miRNA靶基
9、因的获取方法、掌握IncRNA靶 基因的获取方法。基本要求:会使用miRBase、GENCODE数据库下载ncRNA的注释信息、能够获取给定IncRNA 或miRNA的靶基因。4 . ncRNA和复杂疾病基本内容:复杂疾病基因(miRNA、IncRNA和编码基因)数据库的使用、基于表达谱识别疾病106相关miRNA、IncRNAo基本要求:能通过HMDD、lnc2disease、OMIM等数据库获取特定疾病的、IncRNA和编码基因; 编写程序实现基于表达谱疾病相关miRNA、IncRNA的识别。5 .基因注释与功能分类基本内容:超几何检验与DAVID方法用于基因富集分析的结果比拟。基本要求:
10、熟悉DAVID软件的使用;利用R语言进行基因功能富集分析。6 .生物分子网络基本内容:利用R语言构建生物分子网络;使用cytoscape进行网络可视化展示。基本要求:熟悉cytosc叩e软件的使用;利用R语言进行网络构建及拓扑性质分析。四、参考资料生物信息学第2版.李霞主编.人民卫生出版社.2015年6月出版五、学时分配序号教学内容参考学时总学时理论学时实验学时1生物信息学导论4402生物序列资源6423序列比对技术6424序列特征分析4405人类变异组学与复杂疾病分析6426复杂疾病的转录调控与表观遗传分析4407基因表达分析技术与复杂疾病研究8448非编码RNA与人类复杂疾病分析技术8449基因注释与功能分类64210生物分子网络与通路分析方法844合计604020107