《《基因组信息学》教学大纲(本科).pdf》由会员分享,可在线阅读,更多相关《《基因组信息学》教学大纲(本科).pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、77 基因组信息学 一、课程简介 近年来,随着人类基因组计划(HGP)在世界范围内的实施,产生了大量的基因组信息,分析这些信息是人类基因组研究必不可少的重要内容。基因组信息学涉及基因组信息的获取、处理、存储、分配、分析和解释等所有方面。人类基因组共有约 30 亿个碱基对,对如此大量的信息数据进行搜集、存储及分配是生物学领域从未遇到过的问题。这些数据中包括编码人类全部蛋白质和结构核糖核酸(RNA)的信息,以及调控这些蛋白质和核酸装配成生物体的信息。因此解读这些信息是一个很大的难题。基因组信息学主要讲授新一代测序测序技术的原理和方法、测序数据分析方法及应用、核酸序列比对、基因的功能注释与富集、复杂
2、疾病的系统生物学研究及 ncRNA 的功能、ncRNA 与复杂疾病的关系,也就是“读懂”人类基因组。该课程内容需要前期的基础课、专业基础课程知识作为铺垫,充分体现了生物信息学在基因组领域的发展,是生物信息学专业必不可少的专业课之一。通过本课程学习,使学生熟悉网上的各种基因组信息资源,掌握基因组的相关基础知识、基因组信息学的分析流程、基因的功能及其与复杂疾病的关系,具备处理新一代测序数据、基因功能分析、ncRNA 靶基因识别和优化疾病基因等基因组信息学的基本能力。二、理论教学内容 1.新一代测序技术和工作流程 掌握内容:生物信息学概念及其主要特征,新一代测序分析原理流程。了解内容:生物信息学的应
3、用及其在复杂疾病研究中的应用;新一代测序数据的预处理,新一代测序仪的基本技术原理。2.核酸序列比对 掌握内容:描述序列相似性的指标、序列相似性及比对原理;核酸序列分析的基本步骤和方法、基因两两比对算法,局部比对搜索的策略;序列相似性及比对原理。Clustal Omega程序使用方法、多序列比对动态规划算法原理、星型比对及树形比对的基本原理。了解内容:基于BWT方法的短序列比对算法及应用的软件。其他可以进行短序列比对的生物信息学工具。3.DNA和RNA测序的应用 掌握内容:非编码RNA测序及其应用、RNA-seq技术与micro-array技术的比较。了解内容:DNA重测序与个体变异发现、细菌基
4、因组测序与致病性位点发现、宏基因组测序与感染性疾病分析、外显子组测序。4.ChIP-Seq技术及其应用 掌握内容:位置频率矩阵及位置权重矩阵的计算方法及应用。了解内容:ChIP-seq技术的实验原理、转录因子结合位点的预测及分析方法。5.新一代测序在表观遗传研究中的技术及应用 掌握内容:DNA甲基化的定量计算及分析方法。了解内容:MeDIP-seq、MethyCap、RRBS、Infinium甲基化检测技术的特点及应用。6.知识扩展:新一代测序技术相关研究方法纵览、RNA二级结构的研究方法及应用 掌握内容:RNA二级结构概念、SRA数据库的使用方法及数据下载预处理流程。了解内容:单分子测序技术
5、、Hi-C测序、Clip-seq测序等在实际研究中的应用。7.基因注释与功能分类 掌握内容:基因及其产物的注释体系和注释数据库GO和KEGG;基因集功能富集分析方法和常用工具;功能富集分析中的常见注意事项和误区;本体论的概念。78 了解内容:基因及其产物的功能预测方法因组功能注释在功能基因组学中的意义;GO功能注释证据的类型;KEGG其他数据库;GO和KEGG数据库产生与发展历程:功能数据的拓展使用。8.复杂疾病系统生物学 掌握内容:复杂疾病的概念;复杂疾病的特点;精准医学;常用疾病基因数据库OMIM、DO等;复杂疾病系统生物学的理解。了解内容:孟德尔疾病的概念及特点;基因的致病机理。9.nc
6、RNA与靶基因 掌握内容:ncRNA的定义和特点;miRNA及其特点和作用机制;lncRNA及其特点和作用机制;miRNA的靶基因预测算法和原理;miRNA的靶基因预测算法和原理;高通量实验检测miRNA的靶基因;高通量实验检测lncRNA的靶基因。了解内容:miRNA和靶基因数据库;lncRNA和靶基因数据库;miRNA调控生物学网络;lncRNA调控生物学网络。10.ncRNA与复杂疾病 掌握内容:miRNA和lncRNA表达的高通量检测及计算分析;识别疾病相关的新的或已知的 miRNA和lncRNA;miRNA和lncRNA致病机制和功能的预测;致癌ncRNA和抑癌ncRNA的识别。了解
7、内容:miRNA和lncRNA表达检测流程的差异;预测新的lncRNA和miRNA的步骤;常用 的疾病相关miRNA和lncRNA数据库。三、实验教学内容 1.转录组的生物信息学分析实例 基本内容:三大核酸序列数据库的搜索方法、蛋白质数据库的搜索方法;熟悉Clustal Omega 程序;启动子序列motif的识别。基本要求:在GenBank搜索目标序列;利用Clustal Omega程序在本地实现多序列比对。利用工具MEME或编程实现序列motif识别。2.新一代测序数据分析 基本内容:新一代测序数据质量控制分析方法介绍;FastQ及BAM数据格式介绍;Linux环境下分析新一代测序的基本方
8、法。基本要求:熟悉FastQC软件的使用;利用MACS进行ChIP-seq数据分析。3.功能注释和功能富集 基本内容:功能注释数据库内容的浏览、GO和KEGG数据库完成功能注释、利用David实现功能富集分析。基本要求:熟悉功能注释数据库、会使用工具和编程进行功能富集分析。4.ncRNA和靶基因 基本内容:熟悉miRBase、GENCODE数据库、掌握miRNA靶基因的获取方法、掌握lncRNA靶基因的获取方法。基本要求:会使用miRBase、GENCODE数据库下载ncRNA的注释信息、能够获取给定lncRNA或miRNA的靶基因。5.ncRNA和复杂疾病 基本内容:复杂疾病基因(miRNA
9、、lncRNA和编码基因)数据库的使用、基于表达谱识别疾病相关miRNA、lncRNA。基本要求:能通过HMDD、lnc2disease、OMIM等数据库获取特定疾病的、lncRNA和编码基因;编写程序实现基于表达谱疾病相关miRNA、lncRNA的识别。四、参考资料 生物信息学第二版.李霞主编.人民卫生出版社.2015年6月出版 79 五、学时分配 序号 教学内容 参考学时 总学时 理论学时 实验学时 1 新一代测序技术和工作流程 10 6 2 2 核酸序列比对 10 6 2 3 DNA 和 RNA 测序的应用 4 4 2 4 ChIP-Seq 技术及其应用 2 2 2 5 新一代测序在表观遗传研究中的技术及应用 2 2 0 6 知识扩展:新一代测序技术相关研究方法纵览、RNA 二级结构的研究方法及应用 4 4 0 7 基因注释与功能分类 12 8 4 8 复杂疾病系统生物学 6 4 2 9 ncRNA 与靶基因 12 8 4 10 ncRNA 与复杂疾病 6 4 2 合计 68 48 20