测序常用名词解释整理.docx

上传人:C****o 文档编号:26780146 上传时间:2022-07-19 格式:DOCX 页数:19 大小:246.63KB
返回 下载 相关 举报
测序常用名词解释整理.docx_第1页
第1页 / 共19页
测序常用名词解释整理.docx_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《测序常用名词解释整理.docx》由会员分享,可在线阅读,更多相关《测序常用名词解释整理.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -高通量测序领域常用名词说明大全什么是高通量测序?高通量测序技术( High-throughput sequencing,HTS)是对传统 Sanger测序(称为一代测序技术) 革命性的转变 , 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术next generation sequencing,NGS 足见其划时代的转变 , 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序 Deep sequencing。什么是 Sanger

2、 法测序(一代测序)Sanger 法测序利用一种DNA聚合酶来延长结合在待定序列模板上的引物。直到 掺入一种链终止核苷酸为止。 每一次序列测定由一套四个单独的反应构成,每个反应含有全部四种脱氧核苷酸三磷酸dNTP,并混入限量的一种不同的双脱氧核苷三磷酸 ddNTP。由于 ddNTP缺乏延长所需要的3-OH基团,使延长的寡聚核苷酸挑选性的在 G、A、T 或 C 处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和 ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。 它们具有共同的起始点, 但终止在不同的的核苷酸上,可通过高辨论率变性凝胶电泳分别大小不同的片段,凝胶

3、处理后可用X-光胶片放射自显影或非同位素标记进行检测。可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 1 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -什么是基因组重测序( Genome Re-sequencin)g全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变讨论由外显子区域扩大到全基因组范畴。通过构建不

4、同长度的插入片段文库和短序列、 双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重 大的科研和产业价值。什么是 de novo测序de novo 测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种 的基因组图谱。 获得一个物种的全基因组序列是加快对此物种明白的重要捷径。随着新一代测序技术的飞速进展, 基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境, 基因组学讨论也迎来新的进展契机和革命性突破。利用新一代高通量、

5、高效率测序技术以及强大的生物信息分析才能,可以高效、低成本的测定并分析全部生物的基因组序列。可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -测序名词关系图什 么 是 fragments fragments就是打成的片段,而测序测的就是这些fragments ,测出来的结果就是 reads ,又可以分为单端侧和双端侧,单端测序的话,只是从fragments

6、的一端测序,测多长read 就多长,双端测序就是从一个fragments的两端测,就会得出两个 reads什么是 Reads高通量测序平台产生的序列就称为reads 。 测序读到的碱基序列片段,测序的最小单位。 什么是 Contig拼接软件基于 reads 之间的 overlap区,拼接获得的序列称为Contig( 重叠群 )。 由 reads 通过对 overlap区域拼接组装成的 没有 gap 的序列段。 什么是 Contig N50Reads拼接后会获得一些不同长度的Contigs 。将全部的 Contig 长度相加, 能获得一个 Contig总长度。然后将全部的Contigs依据从长到

7、短进行排序,如获得 Contig 1,Contig 2 ,Contig 3.Contig 25 。将 Contig依据这个次序依次相加,当相加的长度达到Contig 总长度的一半时,最终一个加上的Contig 长度即为 Contig N50 。举例: Contig 1+Contig 2+ Contig 3 +Contig 4=Contig可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 3 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - -

8、 - - - - - - - -总长度 *1/2时, Contig4 的长度即为 ContigN50。ContigN50 可以作为基因组拼接的结果好坏的一个判定标准。什么是 Scaffold基因组 de novo 测序(没有参考基因组的测序,需要讨论人员从头拼接得到的序列),通过 reads 拼接获得 Contigs后,往往仍需要构建454 Paired-end库或 Illumina Mate-pair库,以获得肯定大小片段(如3Kb、6Kb、10Kb、20Kb)两端的序列。基于这些序列,可以确定一些Contig之间的次序关系,这些先后次序已知的 Contigs组成 Scaffold。 通过

9、pair ends信息确定出的 contig排列,中间有 gap什么是 Scaffold N50Scaffold N50与 Contig N50的定义类似。 Contigs拼接组装获得一些不同长度 的 Scaffolds。将全部的 Scaffold长度相加,能获得一个Scaffold总长度。然后将全部的 Scaffolds依据从长到短进行排序, 如获得 Scaffold1,Scaffold2, Scaffold 3.Scaffold 25。将 Scaffold依据这个次序依次相加,当相 加的长度达到 Scaffold总长度的一半时,最终一个加上的Scaffold长度即为 ScaffoldN50

10、。举例:Scaffold1+Scaffold2+ Scaffold3 +Scaffold4 +Scaffold 5=Scaffold总长度 *1/2时,Scaffold5 的长度即为 ScaffoldN50。ScaffoldN50 可以作为基因组拼接的结果好坏的一个判定标准。什么是测序深度和掩盖度测序深度 :是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为 2M,测序深度为 10X,那么获得的总数据量为20M。掩盖度 :是指测序获得的序列占整个基因组的比例。Gap:由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获 得的序列往往无法掩盖有所的区域,这部分没有获得

11、的区域就称为。例如一个细菌基因组测序,掩盖度是98%,那么仍有 2%的序列区域是没有通过测序获得的。什么是 RPKM、FPKMRPKM,ReadsPer Kilobaseof exon model per Millionmappedreads,isdefined in thisway Mortazavi etal., 2021:可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 4 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - -

12、- - - - - -每 1 百万个 map上的 reads 中 map到外显子的每 1K 个碱基上的 reads 个数。 假如有 1 百万个 reads 映射到了人的基因组上, 那么详细到每个外显子了, 有多少映射上了了,而外显子的长度不一,那么每1K 个碱基上又有多少reads 映射上了了,这大致就是这个RPKM的直观说明。假如对应特定基因的话,那么就是每1000000 mapped到该基因上的 reads 中每kb 有多少是 mapped到该基因上的 exon 的 readTotal exon reads:This is the number in the column with hea

13、der Total exonreads in the row for the gene. This is the number of reads that havebeenmappedto a regioninwhich an exon isannotatedforthe gene or across theboundaries of two exons or an intron and an exon for an annotatedtranscript ofthe gene. For eukaryotes, exons and their internalrelationships are

14、 defined byannotations of type mRNA.映射到外显子上总的 reads 个数。这个是映射到某个区域上的reads 个数,这个区域或者是已知注释的基因或者跨两个外显子的边界或者是某个基因已经注释的转录本的内含子、外显子。对于真核生物来说,外显子和它们自己内部的关系由某类型的mRNA来注释。Exonlength: This is thenumber in thecolumn with theheader Exon length inthe row for the gene, divided by 1000. This is calculated as the sum

15、of thelengths of all exonsannotatedfor thegene. Each exonis includedonlyonce inthissum, even ifitispresentinmore annotatedtranscriptsforthe gene.Partlyoverlappingexons willcountwiththeirfulllength, even though theyshare the same region.外显子的长度。运算时,运算全部某 个基因已注释的全部外显子长度的总和。即使某个基因以多种注释的转录本出现,这个外显子在求和时只被

16、包含一次。即使部分重叠的外显子共享相同的区域,重叠的外显子以其总长来运算。Mapped reads: The sum of all the numbers in the column with header可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 5 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -Totalgene reads. The Total gene reads for a gene is

17、 the total number ofreads that after mapping have been mapped to the region of the gene.Thus thisincludesallthe reads uniquelymappedtothe regionofthe gene as well asthose of the reads which match in more places below the limitsetinthedialoginfigure18.110 thathave been allocatedtothisgenesregion. A g

18、enes region is that comprised of the flanking regionsif it was specified in figure18.110 , the exons, the introns andacrossexon-exon boundariesof alltranscriptsannotatedforthegene. Thus,the sum of the total gene reads numbers is the number of mapped reads forthesample you can find the number in the

19、RNA-Seq report.map的 reads总和。映射到某个基因上的全部reads 总数。因此这包含全部的唯独映射到这个区域上的 reads 。举例:比如对应到该基因的 read 有 1000 个,总 reads 个数有 100 万,而该基因的外显子总长为 5kb,那么它的 RPKM为:109*1000reads 个数/106 总 reads个数*5000 外显子长度 =200 或者:1000reads 个数/1 百万*5K=200 这个值反映基因的表达水平。FPKMfragments per kilobase of exon per million fragments mapped.

20、FPKM与 RPKM运算方法基本一样。不同点就是FPKM运算的是 fragments ,而 RPKM运算的是 reads 。Fragment 比 read 的含义更广,因此FPKM包含的意义也更广, 可以是 pair-end的一个 fragment ,也可以是一个read 。什么是 soft-clipped reads当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点 及剪接位点的reads 回帖到基因组时,一条reads 被切成两段,匹配到不同的区域,这样的reads 叫做 soft-clipped reads,这些 reads 对于鉴定染色体结构变异及外源序列整合具有重要

21、作用。什么是 multi-hits reads由于大部分测序得到的reads 较短,一个 reads 能够匹配到基因组多个位置,无法区分其真实来源的位置。一些工具依据统计模型,如将这类reads 安排给reads 较多的区域。可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 6 页,共 13 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结什么是外显子测序( whole exon sequencin)g外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕获并富集后 进行高通量测序的基因

22、组分析方法。外显子测序相对于基因组重测序成本较低, 对讨论已知基因的SNP、Indel等具有较大的优势,但无法讨论基因组结构变异如染色体断裂重组等。什么是 mRNA测序 (RNA-seq)转录组学( transcriptomics)是在基因组学后新兴的一门学科,即讨论特定细胞在某一功能状态下所能转录出来的全部RNA(包括 mRNA和非编码 RNA)的类型与拷贝数。 Illumina供应的 mRNA测序技术可在整个mRNA领域进行各种相关讨论和新的发觉。 mRNA测序不对引物或探针进行设计,可自由供应关于转录的客观和权威信息。讨论人员仅需要一次试验即可快速生成完整的poly-A尾的 RNA完整序

23、列信息,并 分析基因表达、 cSNP、全新的转录、全新异构体、剪接位点、 等位基因特异性表达和罕见转录等最全面的转录组信息。简洁的样品制备和数据 分析软件支持在全部物种中的mRNA测序讨论。什么是 small RNA 测序Small RNA(micro RNAs、siRNAs 和 pi RNAs )是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina能够对细胞或者组织中的全部Small RNA 进行深度测序及定量分析等 讨论。试验时 第一将 18-30 nt范畴的 Small RNA 从总 RNA中分别出来,两端分别加上特定接头后

24、体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA 片段进行单向末端直接测序。通过 Illumina对 Small RNA 大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括 新 miRNA分子的挖掘, 其作用靶基因的猜测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等 科学应用。什么是 miRNA测序成熟的 microRNA(miRNA)是 1724nt 的单链非编码RNA分子,通过与 mRNA相互作用影响目标mRNA的稳固性及翻译,最终诱导基因缄默,调控着基因表达、 细胞生长、发育等生物学过程。基于其次代测序技术的microRNA测序,可以一 次性获得

25、数百万条microRNA序列,能够快速鉴定出不同组织、不同发育阶段、可编辑资料 - - - 欢迎下载精品名师归纳总结不同疾病状态下已知和未知的microRNA及其表达差异, 为讨论 microRNA对细胞进程的作用及其生物学影响供应了有力工具。什么是 Chip-seq染色质免疫共沉淀技术(ChromatinImmunoprecipitation, ChIP)也称结合位点分析法,是讨论体内蛋白质与DNA相互作用的有力工具,通常用于转录因子 结合位点或组蛋白特异性修饰位点的讨论。将ChIP 与其次代测序技术相结合的 ChIP-Seq 技术,能够高效的在全基因组范畴内检测与组蛋白、转录因子等互作的

26、DNA区段。ChIP-Seq 的原理是:第一通过染色质免疫共沉淀技术(ChIP)特异性的富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建。然后对富集得到的DNA 片段进行高通量测序。讨论人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范畴内与组蛋白、转录因子等互作的DNA区段信息。什么是 CHIRP-SeqCHIRP-Seq Chromatin Isolation by RNA Purification 是一种检测与 RNA绑定的 DNA和蛋白的高通量测序方法。方法是通过设计生物素或链霉亲和素探针,把目标 RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠

27、 上,最终把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组 的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。 什么是 RIP-seqRNAImmunoprecipitation 是讨论细胞内 RNA与蛋白结合情形的技术,是明白转录后调控网络动态过程的有力工具,能帮忙我们发觉 miRNA的调剂靶点。这种技术运用针对目标蛋白的抗体把相应的 RNA-蛋白复合物沉淀下来,然后经过分别纯化就可以对结合在复合物上的 RNA进行测序分析。RIP 可以看成是普遍使用的染色质免疫沉淀ChIP 技术的类似应用,但由于讨论 对象是 RNA-蛋白复合物而不是DNA-蛋白复合物, R

28、IP 试验的优化条件与ChIP 试验不太相同 (如复合物不需要固定, RIP 反应体系中的试剂和抗体肯定不能含有RNA酶,抗体需经 RIP 试验验证等等)。 RIP 技术下游结合 microarray 技术被称为 RIP-Chip ,帮忙我们更高通量的明白癌症以及其它疾病整体水平的 RNA变化。可编辑资料 - - - 欢迎下载精品名师归纳总结什么是 CLIP-seqCLIP-seq,又称为 HITS-CLIP,即紫外交联免疫沉淀结合高通量测序 crosslinking-immunprecipitation and high-throughput sequencing,是一项在全基因组水平揭示R

29、NA分子与 RNA结合蛋白相互作用的革命性技术。其 主要原理是基于RNA分子与 RNA结合蛋白在紫外照耀下发生耦联,以RNA结合 蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、 RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深化揭示RNA结合蛋白与 RNA分子的调控作用及其对生命的意义。什么是 metagenomic(宏基因组):Magenomics讨论的对象是整个微生物群落。相对于传统单个细菌讨论来说,它具有众多优势,其中很重要的两点:1微生物通常是以群落方式共生于某一小生境中,它们的许多特性是基于整

30、个群落环境及个体间的相互影响的,因此做 Metagenomics 讨论比做单个个体的讨论更能发觉其特性。2 Metagenomics讨论无需分别单个细菌,可以讨论那些不能被试验室分别培育的微生物。宏基因组是基因组学一个新兴的科学讨论方向。宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是讨论直接从环境样本中提取的基因组遗传物质的学科。 传统的微生物讨论依靠于试验室培育,宏基因组的兴起填补了无法在传统试验室中培育的微生物讨论的空白。过去几年中, DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。 什么是 SNP、SNV (单核苷酸位点变异)单核

31、苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。个体间基因组DNA序列同一位置单个核苷酸变异 替代、插入或缺失 所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差 别的现象。有这种差别的基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每 1000 个核苷酸即可能显现1 个单核苷酸多态性的变化,其中有些 单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。 单核苷酸多态性是讨论人类家族和动植物品系遗传变异的重要依据。在讨论癌症基因组变异时,可编辑资料 - - - 欢迎下载精品名师归纳总结相对于正常组织,

32、癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation ),称做 SNV。什么是 INDEL 基因组小片段插入)基因组上小片段( 50bp)的插入或缺失,形同SNP/SN。V什么是 copy number variation(CNV ):基因组拷贝数变异基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。 例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成 1 或 3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。假如把一条染色体分成A-B-C-D 四个区域,就A-B-C-C-D/A-C-B-C-D/A-C

33、-C-B-C-D/A-B-D分别发生了 C区域的扩增及缺失, 扩增的位置可以是连续扩增如A-B-C-C-D 也可以是在其他位置的扩增,如A-C-B-C-D。什么是 structure variation(SV):基因组结构变异染色体结构变异是指在染色体上发生了大片段的变异。主要包括染色体大片段的插入和缺失(引起CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组(inter-chromosome trans-location)等。一般 SV的展现利用 Circos软件。什么是 Segment duplication一般称为 SD区域,串联重复是由序列相近的一些 DNA片段串

34、联组成。 串联重复在人类基因多样性的灵长类基因中发挥重要作用。在人类染色体 Y 和 22 号染色体上,有很大的 SD序列。什么是 genotype and phenotype既基因型与表型。一般指某些单核苷酸位点变异与表现形式间的关系。什么是转录本重构用测序的数据组装成转录本。有两种组装方式:1,de-novo 构建。 2 ,有参考基因组重构。其中 de-novo 组装是指在不依靠参考基因组的情形下,将有 overlap的 reads 连接成一个更长的序列,经过不断的延长,拼成一个个的contig及scaffold。常用工具包括velvet,trans-ABYSS ,Trinity等。有参考基

35、因组重可编辑资料 - - - 欢迎下载精品名师归纳总结构,是指先将 read 贴回到基因组上, 然后在基因组通过reads 掩盖度,junction位点的信息等得到转录本,常用工具包括scripture、cufflinks。什么是 genefusion将基因组位置不同的两个基因中的一部分或全部整合到一起,形成新的基因,称作融合基因,或嵌合体基因。该基因有可能翻译出融合或嵌合体蛋白。什么是表达谱基因表达谱 geneexpression profile:指通过构建处于某一特定状态下的细 胞或组织的非偏性cDNA文库 , 大规模 cDNA测序, 收集 cDNA序列片段、定性、定量分析其 mRNA群体

36、组成 , 从而描画该特定细胞或组织在特定状态下的基因表达 种类和丰度信息 , 这样编制成的数据表就称为基因表达谱什么是功能基因组学功能基因组学( Functuionalgenomics)又往往被称为后基因组学( Postgenomics ),它利用结构基因组所供应的信息和产物,进展和应用新的试验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学讨论 从对单一基因或蛋白质得讨论转向多个基因或蛋白质同时进行系统的讨论。这 是在基因组静态的碱基序列弄清晰之后转入对基因组动态的生物学功能学讨论。讨论内容包括基因功能发觉、基因表达分析及突变检测。基因的功能包括:生 物学功能,如作为蛋白质激酶对

37、特异蛋白质进行磷酸化修饰。细胞学功能,如 参加细胞间和细胞内信号传递途径。发育上功能,如参加形状建成等。采纳的手段包括经典的减法杂交, 差示挑选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析,新的技术应运而生,包括基因表达的系统分析(serialanalysisof gene expression,SAGE ),cDNA微阵列(cDNA microarray), DNA芯片( DNA chip)和序列标志片段显示(sequence taggedfragmentsdisplay。什么是比较基因组学比较基因组学 ComparativeGenomics 是基于基

38、因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来明白基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码次序上和结构上的同源性,克隆可编辑资料 - - - 欢迎下载精品名师归纳总结人类疾病基因, 揭示基因功能和疾病分子机制,阐明物种进化关系, 及基因组的内在结构。什么是表观遗传学表观遗传学是讨论基因的核苷酸序列不发生转变的情形下,基因表达了可遗传 的变化的一门遗传学分支学科。表观遗传的现象许多,已知的有DNA甲基化( DNAmethylation ),基因组印记( genomicimpriting),母体效应( maternaleffects),基因缄默( g

39、enesilencing),核仁显性,休眠转座子激活和 RNA编辑( RNA editing)等。什么是运算生物学运算生物学是指开发和应用数据分析及理论的方法、数学建模、运算机仿真技术等。 当前,生物学数据量和复杂性不断增长,每 14 个月基因讨论产生的数据就会翻一番, 单单依靠观看和试验已难以应对。 因此, 必需依靠大规模运算模拟技术,从海量信息中提取最有用的数据。什么是基因组印记基因组印记 又称遗传印记 是指基因依据亲代的不同而有不同的表达。印记基因的存在能导致细胞中两个等位基因的一个表达而另一个不表达。基因组印记是一正常过程, 此现象在一些低等动物和植物中已发觉多年。印记的基因只占人类基

40、因组中的少数,可能不超过5%,但在胎儿的生长和行为发育中起着至关重 要的作用。 基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常。目前在肿瘤的讨论中认为印记缺失是引起肿瘤最常见的遗传学因素之一。什么是基因组学基因组学(英文genomics),讨论生物基因组和如何利用基因的一门学问。用 于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科供应基因组信息以及相关数据系统利用,试图解决生物, 医学, 和工业领域的重大问题。什么是 DNA甲基化DNA甲基化是指在 DNA甲基化转移酶的作用下, 在基因组 CpG二核苷酸的胞嘧啶5 碳位共价键结合一个甲基基团。正常情形下, 人类基因

41、组“垃圾”序列的CpG二核苷酸相对稀有,并且总是处于甲基化状态,与之相反,人类基因组中大小可编辑资料 - - - 欢迎下载精品名师归纳总结为 1001000 bp 左右且富含 CpG二核苷酸的 CpG岛就总是处于未甲基化状态, 并且与 56的人类基因组编码基因相关。人类基因组序列草图分析结果说明, 人类基因组 CpG岛约为 28890 个,大部分染色体每1 Mb 就有 515 个 CpG岛,平均值为每 Mb含 105 个 CpG岛, CpG岛的数目与基因密度有良好的对应关系9 。由于 DNA甲基化与人类发育和肿瘤疾病的亲密关系,特殊是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因组学的 重要讨论内容。什么是基因组注释基因组注释 Genomeannotation是利用生物信息学方法和工具, 对基因组全部基因的生物学功能进行高通量注释, 是当前功能基因组学讨论的一个热点。基因组注释的讨论内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中全部基因的准确位置。可编辑资料 - - - 欢迎下载

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁