《第3章 基因与基因组.ppt》由会员分享,可在线阅读,更多相关《第3章 基因与基因组.ppt(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第3章章 基因与基因组基因与基因组 本课程的任务是介绍生物大分子的结构与功能;本课程的任务是介绍生物大分子的结构与功能;复制、转录、翻译的过程和基因表达调控的方复制、转录、翻译的过程和基因表达调控的方式以及分子生物学的常用技术与应用。使学生式以及分子生物学的常用技术与应用。使学生了解有关分子生物学的基本理论知识和研究方了解有关分子生物学的基本理论知识和研究方法,为今后的学习、科研打下良好的分子生物法,为今后的学习、科研打下良好的分子生物学基础。学基础。教学目的、任务教学目的、任务主要内容主要内容第一章第一章绪 论(Course introduction)第二章细胞与生物大分子(Cells a
2、nd macromolecules)第三章原核与真核生物的基因组(Prokaryotic and eukaryotic chromosome structure)第四章第四章DNA复制(DNA replication)第五章DNA损伤、修复和重组(DNA damage,repair and recombination)第六章原核转录(Transcription in prokaryotes)第七章第七章原核转录调控(Regulation of transcription in prokaryotes)第八章真核转录(Transcription in eukaryotes)第九章真核转录调控(R
3、egulation of transcription in eukaryotes)第十章RNA加工和核糖核蛋白(RNA processing and RNPs第十一章遗传密码与tRNA(genetic codon and tRNA)第十二章蛋白翻译(protein synthesis)第十三章第十三章分子生物学研究方法(molecular biology technology)第十四章第十四章分子生物学研究热点 教材及主要参考书教材及主要参考书教材:赵亚华教材:赵亚华 基础分子生物学教程,科学出版社基础分子生物学教程,科学出版社 P.C.Turner et al.2009.Instant No
4、tes in Molecular Biology(分子生物学精要速览分子生物学精要速览),3rd edition,Bios Scientific Publishers Limited.朱玉贤朱玉贤 现代分子生物学,高等教育出版社现代分子生物学,高等教育出版社孙乃恩孙乃恩 分子遗传学,南京大学出版社。分子遗传学,南京大学出版社。阎隆飞阎隆飞 分子生物学,中国农业大学出版社,分子生物学,中国农业大学出版社,李振刚李振刚 分子遗传学,科学出版社分子遗传学,科学出版社Jame Watson等著等著.Molecular Biology of the Gene(第五版第五版),Cold Spring Ha
5、rbor Press出版,出版,2004.Weaver R.Molecular Biology.科学出版社科学出版社学习方法学习方法1.注重理解,融会贯通注重理解,融会贯通 重点强调知识体系的建立,掌握脉络、主干和重点。重点强调知识体系的建立,掌握脉络、主干和重点。2.勤学多问,孜孜不倦勤学多问,孜孜不倦 善于勤学多问,与老师、同学多交流探讨。善于勤学多问,与老师、同学多交流探讨。3.跟踪前沿,引深思维跟踪前沿,引深思维经常查阅相关文献经常查阅相关文献4.举一反三,温故知新举一反三,温故知新做好预习、经常复习做好预习、经常复习5.勤做笔记勤做笔记考核方式考核方式:考试考试 1 1期末闭卷考试:
6、期末闭卷考试:5050 2 2平时成绩:平时成绩:50%50%(考勤考勤10%+课堂表现课堂表现10%+作业作业成绩成绩30%+期中考试成绩期中考试成绩50%)考考 核核 第三章第三章第三章第三章 原核与真核生物的基因组原核与真核生物的基因组原核与真核生物的基因组原核与真核生物的基因组 教学目的和要求教学目的和要求1.掌握基因、基因组、断裂基因、基因家掌握基因、基因组、断裂基因、基因家族、内含子、外显子等基本概念。族、内含子、外显子等基本概念。2.掌握原核生物与真核生物基因组的结构掌握原核生物与真核生物基因组的结构特点。特点。3.理解基因组复杂度。理解基因组复杂度。主要内容主要内容第第1节节
7、基因与基因组基因与基因组第第2节节 病毒基因组病毒基因组第第3节节 原核生物基因组原核生物基因组第第4节节 真核生物基因组真核生物基因组第第1节节 基因与基因组基因与基因组一、一、基因的概念基因的概念二、基因的命名二、基因的命名三、基因组三、基因组 基因基因基因基因(genegenegenegene):原核生物、真核生物以及病原核生物、真核生物以及病原核生物、真核生物以及病原核生物、真核生物以及病毒的毒的毒的毒的DNADNA和和和和RNARNA分子中具有遗传效应的核分子中具有遗传效应的核分子中具有遗传效应的核分子中具有遗传效应的核苷酸序列,是遗传的基本单位。苷酸序列,是遗传的基本单位。苷酸序列
8、,是遗传的基本单位。苷酸序列,是遗传的基本单位。一、一、一、一、基因的概念基因的概念基因的概念基因的概念在细菌中在细菌中在细菌中在细菌中:指编码一个蛋白质或指编码一个蛋白质或指编码一个蛋白质或指编码一个蛋白质或RNARNA的遗传功能单的遗传功能单的遗传功能单的遗传功能单位;位;位;位;在真核细胞中在真核细胞中在真核细胞中在真核细胞中:指编码一个或多个产物的,或对某指编码一个或多个产物的,或对某指编码一个或多个产物的,或对某指编码一个或多个产物的,或对某一个产物产生有贡献的一个转录单位。一个产物产生有贡献的一个转录单位。一个产物产生有贡献的一个转录单位。一个产物产生有贡献的一个转录单位。1 1
9、1 1、基因与、基因与、基因与、基因与DNADNADNADNAJJ基因是基因是基因是基因是基因是基因是DNADNADNADNADNADNA分子上分子上分子上分子上分子上分子上的的的的的的功能单位功能单位功能单位功能单位功能单位功能单位:遗传单位、:遗传单位、:遗传单位、:遗传单位、:遗传单位、:遗传单位、交换单位、突变单位交换单位、突变单位交换单位、突变单位交换单位、突变单位交换单位、突变单位交换单位、突变单位JJ一个基因一个顺反子一个基因一个顺反子一个基因一个顺反子一个基因一个顺反子一个基因一个顺反子一个基因一个顺反子突变单位重组突变单位重组突变单位重组突变单位重组突变单位重组突变单位重组单
10、位单位单位单位单位单位JJ顺反子:一段核苷酸序列,能编码一条完顺反子:一段核苷酸序列,能编码一条完顺反子:一段核苷酸序列,能编码一条完顺反子:一段核苷酸序列,能编码一条完顺反子:一段核苷酸序列,能编码一条完顺反子:一段核苷酸序列,能编码一条完整多肽链(整多肽链(整多肽链(整多肽链(整多肽链(整多肽链(具有生物学活性具有生物学活性具有生物学活性具有生物学活性具有生物学活性具有生物学活性)。)。)。)。)。)。JJ基因的基因的基因的基因的基因的基因的DNADNADNADNADNADNA共性共性共性共性共性共性:从细菌到哺乳动物的全:从细菌到哺乳动物的全:从细菌到哺乳动物的全:从细菌到哺乳动物的全:
11、从细菌到哺乳动物的全:从细菌到哺乳动物的全部生命有机体的基因都是由部生命有机体的基因都是由部生命有机体的基因都是由部生命有机体的基因都是由部生命有机体的基因都是由部生命有机体的基因都是由DNADNADNADNADNADNA构成的。在构成的。在构成的。在构成的。在构成的。在构成的。在分子水平上,所有分子水平上,所有分子水平上,所有分子水平上,所有分子水平上,所有分子水平上,所有生物生物生物生物生物生物DNADNADNADNADNADNA基本结构都一致基本结构都一致基本结构都一致基本结构都一致基本结构都一致基本结构都一致,称为共性。但是,它们的称为共性。但是,它们的称为共性。但是,它们的称为共性。
12、但是,它们的称为共性。但是,它们的称为共性。但是,它们的DNADNADNADNADNADNA序列上的不同序列上的不同序列上的不同序列上的不同序列上的不同序列上的不同形成了千差万别的生物界。因此,来自两种形成了千差万别的生物界。因此,来自两种形成了千差万别的生物界。因此,来自两种形成了千差万别的生物界。因此,来自两种形成了千差万别的生物界。因此,来自两种形成了千差万别的生物界。因此,来自两种生命形态的基因(生命形态的基因(生命形态的基因(生命形态的基因(生命形态的基因(生命形态的基因(DNADNADNADNADNADNA)可以相互可以相互可以相互可以相互可以相互可以相互融合重组融合重组融合重组融
13、合重组融合重组融合重组。2 2 2 2、基因与多肽链、基因与多肽链、基因与多肽链、基因与多肽链JJ基因的主要基因的主要基因的主要基因的主要基因的主要基因的主要编码产物编码产物编码产物编码产物编码产物编码产物是是是是是是多肽链多肽链多肽链多肽链多肽链多肽链,另外还包,另外还包,另外还包,另外还包,另外还包,另外还包括许多编码括许多编码括许多编码括许多编码括许多编码括许多编码RNARNARNARNARNARNA的基因,如:的基因,如:的基因,如:的基因,如:的基因,如:的基因,如:rRNArRNArRNArRNArRNArRNA基因、基因、基因、基因、基因、基因、tRNAtRNAtRNAtRNAt
14、RNAtRNA基因以及其它小分子基因以及其它小分子基因以及其它小分子基因以及其它小分子基因以及其它小分子基因以及其它小分子RNARNARNARNARNARNA基因等。基因等。基因等。基因等。基因等。基因等。JJ一种基因一种酶一种基因一种酶一种基因一种酶一种基因一种酶一种基因一种酶一种基因一种酶(194119411941194119411941)JJ基因的碱基序列与蛋白质分子中氨基酸的基因的碱基序列与蛋白质分子中氨基酸的基因的碱基序列与蛋白质分子中氨基酸的基因的碱基序列与蛋白质分子中氨基酸的基因的碱基序列与蛋白质分子中氨基酸的基因的碱基序列与蛋白质分子中氨基酸的序列之间的对应关系是通过序列之间的
15、对应关系是通过序列之间的对应关系是通过序列之间的对应关系是通过序列之间的对应关系是通过序列之间的对应关系是通过遗传密码遗传密码遗传密码遗传密码遗传密码遗传密码实现的。实现的。实现的。实现的。实现的。实现的。3 3、基因的结构、基因的结构JJ编码区编码区编码区编码区编码区编码区(coding regionscoding regionscoding regionscoding regionscoding regionscoding regions),开放阅读框开放阅读框开放阅读框开放阅读框开放阅读框开放阅读框(open reading frame,ORFopen reading frame,ORF
16、open reading frame,ORFopen reading frame,ORFopen reading frame,ORFopen reading frame,ORF):可以翻译成蛋白可以翻译成蛋白可以翻译成蛋白可以翻译成蛋白可以翻译成蛋白可以翻译成蛋白质的质的质的质的质的质的DNADNADNADNADNADNA区域。在细菌中即为一个基因;在真区域。在细菌中即为一个基因;在真区域。在细菌中即为一个基因;在真区域。在细菌中即为一个基因;在真区域。在细菌中即为一个基因;在真区域。在细菌中即为一个基因;在真核细胞中,编码区可被内含子隔断。核细胞中,编码区可被内含子隔断。核细胞中,编码区可被
17、内含子隔断。核细胞中,编码区可被内含子隔断。核细胞中,编码区可被内含子隔断。核细胞中,编码区可被内含子隔断。JJ非编码区非编码区非编码区非编码区非编码区非编码区(internal internal internal internal internal internal noncodingnoncodingnoncodingnoncodingnoncodingnoncoding regions regions regions regions regions regions),非翻非翻非翻非翻非翻非翻译区译区译区译区译区译区(untranslateduntranslateduntranslated
18、untranslateduntranslateduntranslated regions,UTRsregions,UTRsregions,UTRsregions,UTRsregions,UTRsregions,UTRs):转录单位转录单位转录单位转录单位转录单位转录单位中不能翻译成蛋白质的部分。在编码区或操纵中不能翻译成蛋白质的部分。在编码区或操纵中不能翻译成蛋白质的部分。在编码区或操纵中不能翻译成蛋白质的部分。在编码区或操纵中不能翻译成蛋白质的部分。在编码区或操纵中不能翻译成蛋白质的部分。在编码区或操纵子两侧的子两侧的子两侧的子两侧的子两侧的子两侧的UTRsUTRsUTRsUTRsUTRsU
19、TRs为为为为为为555555和和和和和和3UTRs3UTRs3UTRs3UTRs3UTRs3UTRs(或称为前导和或称为前导和或称为前导和或称为前导和或称为前导和或称为前导和尾随序列)。尾随序列)。尾随序列)。尾随序列)。尾随序列)。尾随序列)。JJ操纵子操纵子操纵子操纵子操纵子操纵子(operator)(operator)(operator)(operator)(operator)(operator):包含几个基因及其共同调包含几个基因及其共同调包含几个基因及其共同调包含几个基因及其共同调包含几个基因及其共同调包含几个基因及其共同调控元件的细菌基因座。控元件的细菌基因座。控元件的细菌基因座
20、。控元件的细菌基因座。控元件的细菌基因座。控元件的细菌基因座。JJ基因座基因座基因座基因座基因座基因座(locus)(locus)(locus)(locus)(locus)(locus):一个基因在染色体、物理图、一个基因在染色体、物理图、一个基因在染色体、物理图、一个基因在染色体、物理图、一个基因在染色体、物理图、一个基因在染色体、物理图、遗传图上的位置,包括两侧的调控元件。基遗传图上的位置,包括两侧的调控元件。基遗传图上的位置,包括两侧的调控元件。基遗传图上的位置,包括两侧的调控元件。基遗传图上的位置,包括两侧的调控元件。基遗传图上的位置,包括两侧的调控元件。基因座本义指任何标记物的位置,
21、包括基因、因座本义指任何标记物的位置,包括基因、因座本义指任何标记物的位置,包括基因、因座本义指任何标记物的位置,包括基因、因座本义指任何标记物的位置,包括基因、因座本义指任何标记物的位置,包括基因、调控元件、复制起始区、细胞遗传学中的标调控元件、复制起始区、细胞遗传学中的标调控元件、复制起始区、细胞遗传学中的标调控元件、复制起始区、细胞遗传学中的标调控元件、复制起始区、细胞遗传学中的标调控元件、复制起始区、细胞遗传学中的标记等。记等。记等。记等。记等。记等。NCNCNC5533转录转录 翻译翻译5 UTR3 UTRUTRUTRgene1gene3gene2原核细胞编码蛋白质基因的典型结构原核
22、细胞编码蛋白质基因的典型结构在在细菌中,同一转录单位包含多个基因,每细菌中,同一转录单位包含多个基因,每一个基因编码一条独立的多肽链。一个基因编码一条独立的多肽链。RNADNA翻译翻译翻译翻译protein真核细胞编码蛋白质基因的典型结构真核细胞编码蛋白质基因的典型结构在在真核生物中,转录单位由单个基因组成。成熟的转录物编真核生物中,转录单位由单个基因组成。成熟的转录物编码单个多肽链,但不同的剪接方式可产生一系列不同的产物。码单个多肽链,但不同的剪接方式可产生一系列不同的产物。NC53转录转录5 UTR3 UTRintronintronexon1exon3exon2前体前体RNADNA翻译翻译
23、protein编码区域编码区域53mRNARNA加工(剪接、转运)加工(剪接、转运)7meGAAAAAAAAAAAAThe processing of a 45S rRNA precursor molecule into three separate ribosomal The processing of a 45S rRNA precursor molecule into three separate ribosomal RNAs.Nearly half of the nucleotide sequences in the primary RNA transcript RNAs.Nearly
24、 half of the nucleotide sequences in the primary RNA transcript are degraded in the nucleus.are degraded in the nucleus.JJ外显子(外显子(外显子(外显子(外显子(外显子(exonexonexonexonexonexon):):):):):):基因中编码的序列,转基因中编码的序列,转基因中编码的序列,转基因中编码的序列,转基因中编码的序列,转基因中编码的序列,转录单位余下部分通过剪接结合起来并表达的录单位余下部分通过剪接结合起来并表达的录单位余下部分通过剪接结合起来并表达的录
25、单位余下部分通过剪接结合起来并表达的录单位余下部分通过剪接结合起来并表达的录单位余下部分通过剪接结合起来并表达的区域,是基因中对应于区域,是基因中对应于区域,是基因中对应于区域,是基因中对应于区域,是基因中对应于区域,是基因中对应于mRNAmRNAmRNAmRNAmRNAmRNA序列的区域。序列的区域。序列的区域。序列的区域。序列的区域。序列的区域。JJ内含子(内含子(内含子(内含子(内含子(内含子(intronintronintronintronintronintron):):):):):):基因中不编码的、打基因中不编码的、打基因中不编码的、打基因中不编码的、打基因中不编码的、打基因中不编
26、码的、打断转录单位的间插序列,必需在断转录单位的间插序列,必需在断转录单位的间插序列,必需在断转录单位的间插序列,必需在断转录单位的间插序列,必需在断转录单位的间插序列,必需在RNARNARNARNARNARNA水平上水平上水平上水平上水平上水平上去除。去除。去除。去除。去除。去除。二、基因的命名二、基因的命名二、基因的命名二、基因的命名三、基因组三、基因组1.基因组的概念基因组的概念 是指一种生物体中的整套遗传信息,一般为一个受精卵是指一种生物体中的整套遗传信息,一般为一个受精卵或一个体细胞的细胞核中所有或一个体细胞的细胞核中所有DNA分子的总和。分子的总和。一特定生物体的整套一特定生物体的
27、整套(单倍体单倍体)遗传物质的总和。遗传物质的总和。基因组的大小用全部基因组的大小用全部DNA的碱基对总数表示。的碱基对总数表示。每种真核生物的单倍体基因组中的全部每种真核生物的单倍体基因组中的全部DNA量称为量称为C值值(C-Value)。23 三、基因组三、基因组2.基因、核酸片段大小表示法:基因、核酸片段大小表示法:单链核酸:碱基数单链核酸:碱基数 nucleotide,nt 双链核酸:碱基对双链核酸:碱基对 base pair,bp 千碱基对千碱基对 kilo base pair,Kb 兆碱基对兆碱基对 mega base pair,Mb 1Mb=1000Kb=1000000bp 例例
28、如如:乙乙肝肝病病毒毒基基因因组组DNA有有3200bp或或3.2Kb。痘痘病病毒毒基基因组因组DNA有有300Kb。生物界生物界C C值大小规律:值大小规律:病毒病毒 细菌细菌 真菌真菌 动植物动植物 进化程度递增,进化程度递增,C C值递增值递增 3.基因组大小与基因组大小与C值矛盾值矛盾随着生物的进化,生物体的结构和功随着生物的进化,生物体的结构和功能越来越复杂,其能越来越复杂,其C值就越大。值就越大。25 3-2102cm1.226 然然然然而而而而另另另另一一一一方方方方面面面面,随随随随着着着着进进进进一一一一步步步步的的的的进进进进化化化化,生生生生物物物物体体体体复复复复杂杂杂
29、杂性性性性和和和和DNADNA含含含含量量量量之之之之间间间间的的的的关关关关系系系系变变变变模模模模糊糊糊糊了了了了,出出出出现现现现了了了了很很很很多多多多令令令令人人人人不不不不解解解解的的的的现现现现象象象象。一一一一些些些些生生生生物物物物类类类类群群群群基基基基因因因因组组组组大大大大小小小小的的的的变变变变化化化化范范范范围围围围很很很很窄窄窄窄,而而而而另另另另一一一一些些些些类类类类群群群群的变化范围则很宽。的变化范围则很宽。的变化范围则很宽。的变化范围则很宽。突突突突出出出出的的的的例例例例子子子子是是是是两两两两栖栖栖栖动动动动物物物物,C C值值值值小小小小的的的的可可
30、可可以以以以低低低低至至至至10109 9bpbp以以以以下下下下,C C值值值值大大大大的的的的可可可可以以以以高高高高达达达达10101111bpbp。而而而而哺哺哺哺乳乳乳乳动动动动物物物物的的的的C C值值值值均均均均为为为为10109 9bpbp的的的的数数数数量量量量级级级级。人人人人们们们们很很很很难难难难相相相相信信信信不不不不同同同同的的的的两两两两栖栖栖栖动动动动物物物物,所所所所需需需需基基基基因因因因的的的的数数数数量量量量会会会会有有有有100100倍倍倍倍的的的的差差差差别别别别,而而而而且且且且两两两两栖栖栖栖动动动动物物物物的的的的结结结结构构构构和和和和功功功
31、功能能能能会会会会比比比比哺哺哺哺乳乳乳乳动物更复杂。动物更复杂。动物更复杂。动物更复杂。3.基因组大小与基因组大小与C值矛盾值矛盾 由由由由于于于于人人人人们们们们无无无无法法法法用用用用已已已已知知知知功功功功能能能能来来来来解解解解释释释释基基基基因因因因组组组组的的的的DNADNA含含含含量量量量,所所所所以以以以产产产产生生生生了了了了C C值值值值矛矛矛矛盾盾盾盾(C(C value value paradoxparadox,又又又又称称称称C C值悖理值悖理值悖理值悖理)。C C C C值值值值矛矛矛矛盾盾盾盾(C C C C value value value value pa
32、radox,paradox,paradox,paradox,C C C C值值值值悖悖悖悖论论论论):生生生生物物物物体体体体的的的的进进进进化化化化程程程程度度度度与与与与基基基基因因因因组组组组大大大大小小小小(C C C C值值值值)之之之之间间间间不不不不完完完完全全全全成成成成比例的现象。比例的现象。比例的现象。比例的现象。3.基因组大小与基因组大小与C值矛盾值矛盾 病毒是由一个或几个核酸分子组成的基因组,病毒是由一个或几个核酸分子组成的基因组,有一层蛋白或脂蛋白保护性外壳,且可在一定有一层蛋白或脂蛋白保护性外壳,且可在一定宿主细胞中自我复制的感染性因子。宿主细胞中自我复制的感染性因
33、子。第第2节节 病毒基因组病毒基因组一、病毒基因组的类型双链双链DNA病毒病毒乙肝病毒乙肝病毒单链单链DNA病毒病毒微小病毒微小病毒双链双链RNA病毒病毒动物呼肠孤病毒动物呼肠孤病毒单链(单链(+或或-)RNA病毒病毒逆转录病毒逆转录病毒DNA病毒病毒 RNA病毒病毒遗传物质:遗传物质:遗传物质:遗传物质:遗传物质:遗传物质:DNA DNA DNA 或或或或或或 RNA RNA RNA,单倍体(反转录病毒,单倍体(反转录病毒,单倍体(反转录病毒,单倍体(反转录病毒,单倍体(反转录病毒,单倍体(反转录病毒除外);除外);除外);除外);除外);除外);基因组很小,基因组很小,基因组很小,基因组很
34、小,基因组很小,基因组很小,但相差较大;但相差较大;但相差较大;但相差较大;但相差较大;但相差较大;基因重叠;基因重叠;基因重叠;基因重叠;基因重叠;基因重叠;编码效率高、非编码区小;编码效率高、非编码区小;编码效率高、非编码区小;编码效率高、非编码区小;编码效率高、非编码区小;编码效率高、非编码区小;基因往往丛集形成一个功能单位或转录单元;基因往往丛集形成一个功能单位或转录单元;基因往往丛集形成一个功能单位或转录单元;基因往往丛集形成一个功能单位或转录单元;基因往往丛集形成一个功能单位或转录单元;基因往往丛集形成一个功能单位或转录单元;噬菌体的基因是连续的噬菌体的基因是连续的噬菌体的基因是连
35、续的噬菌体的基因是连续的噬菌体的基因是连续的噬菌体的基因是连续的。二、病毒基因组的基本特点二、病毒基因组的基本特点重叠基因(重叠基因(overlapping gene):两个基因的核苷酸序列完全重):两个基因的核苷酸序列完全重叠或部分重叠的情况叠或部分重叠的情况,即一段核苷酸片段被两个基因重复使用的即一段核苷酸片段被两个基因重复使用的现象。现象。31 部分重叠部分重叠 K和和C 两个基因共用少数碱基对两个基因共用少数碱基对 如:如:A*和和C D和和J-ATGATGA-A-CStart codon-TA-TAA ATG-TG-A*Stop codon DStop codonJ Start co
36、don 一、原核生物基因组的特点一、原核生物基因组的特点 拟核(类核)结构;基因组相对较小,由拟核(类核)结构;基因组相对较小,由DNA组成,包括染组成,包括染色体色体DNA和质粒和质粒DNA两种两种DNA分子,均为共价闭环双链。染分子,均为共价闭环双链。染色体色体DNA为单拷贝为单拷贝 存在多顺反子结构;功能相关的基因常常组织形成操纵子结存在多顺反子结构;功能相关的基因常常组织形成操纵子结构,操纵子结构是原核基因组的一个突出的结构特点。构,操纵子结构是原核基因组的一个突出的结构特点。除除RNA基因外,基本是单拷贝的;基因外,基本是单拷贝的;利于核糖体的快速组装,短时间内合成利于核糖体的快速组
37、装,短时间内合成 大量核糖体。大量核糖体。结构基因通常为连续基因,非编码区和重复序列少;结构基因通常为连续基因,非编码区和重复序列少;存在不同的功能识别区,每个存在不同的功能识别区,每个DNA分子(染色体分子(染色体DNA和质粒和质粒DNA)只有一个复制起始点。)只有一个复制起始点。复制起始区、复制终止区等复制起始区、复制终止区等含可转移的序列,如插入序列、转座子等。含可转移的序列,如插入序列、转座子等。第第3节节 原核生物基因组原核生物基因组Bacterial chromosome 细菌染色体细菌染色体Nucleoid Negatively supercoiled(负超螺旋负超螺旋)as a
38、 whole核中央由支架蛋核中央由支架蛋白和白和RNA组成,组成,环状双链环状双链DNA绕绕在支架蛋白的外在支架蛋白的外围,只有一个复围,只有一个复制起点,制起点,DNA与与细胞膜粘在一起细胞膜粘在一起,DNA上有结合上有结合蛋白。蛋白。原核生物基因组一、真核生物基因组特点:一、真核生物基因组特点:一、真核生物基因组特点:一、真核生物基因组特点:真核生物基因组真核生物基因组真核生物基因组真核生物基因组DNADNA与蛋白质结合形成染色体,储与蛋白质结合形成染色体,储与蛋白质结合形成染色体,储与蛋白质结合形成染色体,储存于细胞核内,存于细胞核内,存于细胞核内,存于细胞核内,体细胞是双倍体体细胞是双
39、倍体体细胞是双倍体体细胞是双倍体(diploiddiploiddiploiddiploid),),),),即有即有即有即有两份同源的基因组。两份同源的基因组。两份同源的基因组。两份同源的基因组。真核细胞基因转录产物为单顺反子。真核细胞基因转录产物为单顺反子。真核细胞基因转录产物为单顺反子。真核细胞基因转录产物为单顺反子。存在重复序列,重复次数可达百万次以上。存在重复序列,重复次数可达百万次以上。存在重复序列,重复次数可达百万次以上。存在重复序列,重复次数可达百万次以上。基因组中不编码的区域多于编码区域。基因组中不编码的区域多于编码区域。基因组中不编码的区域多于编码区域。基因组中不编码的区域多于
40、编码区域。大部分基因含有内含子,因此,基因是不连续的。大部分基因含有内含子,因此,基因是不连续的。大部分基因含有内含子,因此,基因是不连续的。大部分基因含有内含子,因此,基因是不连续的。基因组远远大于原核生物的基因组,具有许多复制基因组远远大于原核生物的基因组,具有许多复制基因组远远大于原核生物的基因组,具有许多复制基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。起点,而每个复制子的长度较小。起点,而每个复制子的长度较小。起点,而每个复制子的长度较小。第第4节节 原核生物基因组原核生物基因组二、二、基因组的复杂度基因组的复杂度Genomic DNA extractio
41、n Sonication or shearing to a uniform size(x 100-1000 bp)Thermal Denaturation Re-annealing Measure&plotting the re-annealing process will yield kinetics1.复性动力学曲线复性动力学曲线Measuring methods:Spectroscopy/UV absorptionhydroxyapatite(羟羟基基磷灰石磷灰石)chromotographyD4 Genome ComplexityHighly repetitive DNAmoderat
42、ely repetitive DNAunique DNAHumanE.coli二、二、基因组的复杂度基因组的复杂度1)据基因组重复次数高低:据基因组重复次数高低:重复序列重复序列 Unique sequence DNA单一序列单一序列DNA 1101 moderately repetitive DNA中度重复序列中度重复序列 10 105 Highly repetitive DNA高度重复序列高度重复序列 106Unique sequence DNA单一序列单一序列DNA复性最慢复性最慢在基因组中有一个或几个拷贝。真核生物的大多数基因在单倍体中都是单拷贝的。如:蛋清蛋白、血红蛋白等)单一序列中
43、储存了巨大的遗传信息,编单一序列中储存了巨大的遗传信息,编码各种不同功能的蛋白质。码各种不同功能的蛋白质。moderately repetitive DNA中度重复序列中度重复序列中度重复序列是指在基因组中重复十几中度重复序列是指在基因组中重复十几次至几十万次的部分,其复性速度快于次至几十万次的部分,其复性速度快于单拷贝序列,但慢于高度重复序列。单拷贝序列,但慢于高度重复序列。中度重复序列在基因组中所占比例在不中度重复序列在基因组中所占比例在不同种属之间差异很大,一般为同种属之间差异很大,一般为1235%,人类基因组中约占,人类基因组中约占12%。moderately repetitive D
44、NA中度重复序列中度重复序列 Tandem gene clusters(串联基因簇)串联基因簇):通常是其基因产物需求量很高的基因,如通常是其基因产物需求量很高的基因,如rRNA基因、组蛋白基因、免疫球蛋白基基因、组蛋白基因、免疫球蛋白基因、因、tRNA基因等,这些结构基因常常以基因等,这些结构基因常常以串联形式排列在基因组中,故也属于串串联形式排列在基因组中,故也属于串联重复序列联重复序列各种生物组蛋白基因在基因组中重复频率不同。如海胆中的组蛋白基因重复3001000次,果蝇的重复约110次,人的组蛋白基因重复3040次。moderately repetitive DNA中度重复序列中度重复
45、序列Dispersed repetitive DNA(离散重复序列离散重复序列)分散在整个基因组中分散在整个基因组中Short interspersed elements(短散布元件短散布元件)+long interspersed elements(长散布元件长散布元件)灵长类所特有的灵长类所特有的Alu重复序列家族重复序列家族:300bp,300 000 500 000 copies of 80-90%identity(短散短散布元件布元件)Kpn重复序列家族重复序列家族(长散布元件长散布元件):重复单位一重复单位一般为般为6 7 kbFunctions of these repetitiv
46、e DNA:largely unknown在单倍体人基因组中有在单倍体人基因组中有5105个拷贝,约占人基个拷贝,约占人基因组的因组的3-6%。每个重复。每个重复单元的长度为单元的长度为300bp,含含一个一个Alu酶切位点,因而酶切位点,因而得名。酶切后生成得名。酶切后生成130bp和和170bp两个片段,每个两个片段,每个Alu片段两侧有片段两侧有6-20bp的的同向重复序列,存在于同向重复序列,存在于间隔区(间隔区(space)和内含)和内含子中。子中。功能:可能与基因转录、功能:可能与基因转录、调控、加工有关。调控、加工有关。Highly repetitive DNA高度重复序列高度重
47、复序列 重复次数重复次数 106,序列较短,大部分集中在异染,序列较短,大部分集中在异染色质中(中心粒和端粒的附近)真核生物中含色质中(中心粒和端粒的附近)真核生物中含1020%。特点:特点:A、T含量高,序列简单,不转录含量高,序列简单,不转录.其功能尚不清楚。其功能尚不清楚。如如Satellite DNA(卫星卫星DNA)Highly repetitive DNA高度重复序列高度重复序列Satellite DNA(卫星卫星DNA,simple sequence,随体随体DNA):含有异常的碱基,在密度梯度离心中形成一种含有异常的碱基,在密度梯度离心中形成一种区别于其它区别于其它DNA的卫星
48、条带。的卫星条带。卫星卫星DNA的重复单位一般由的重复单位一般由210 bp组成,组成,成串排列。成串排列。卫星卫星DNA占基因组的比例随种属而异,在占基因组的比例随种属而异,在0.531%范围内。范围内。Satellite DNAMouse genome DNA30%GC in satellite DNAD4 Genome ComplexityCsCl centrifugation人类基因组中可分离出三类卫星DNA,共占人类基因组的5 6%:大卫星DNA(macrosatellite DNA):n其重复单位为5171 bp,主要分布于染色体的着丝粒区。小卫星DNA(minisatellite
49、 DNA):n其重复单位为1570 bp,存在于常染色。微卫星DNA(microsatellite DNA):n其重复单位为25 bp,存在于常染色体。重复单位常存在序列变异,反映卫星重复单位常存在序列变异,反映卫星DNA可能在经过可能在经过串联重复后发生突变、重复和缺失而得以进化。在真串联重复后发生突变、重复和缺失而得以进化。在真核生物之间,核生物之间,satellite DNA 总量在总量在2%5%,甚至在亲甚至在亲缘关系密切相关的两个物种之间,缘关系密切相关的两个物种之间,satellite DNA也会也会有悬殊的差别。有悬殊的差别。进行进行DNA指纹分析。指纹分析。三、断裂基因、多基因
50、家族与假基因1.断裂基因的概念 基因的编码顺序由若干非编码区域(间隔序列)隔开,使阅读框不连续,这种基因称为割裂基因(split gene,interrupted gene断裂基因)。是编码序列在DNA分子上不连续排列而被不编码的序列所隔开的基因。割裂基因割裂基因 前体前体mRNA Introns 去除去除 Exons 连接连接 三、断裂基因、多基因家族与假基因2.基因家族(multigene family)指DNA序列具有较高的同源性(通常大于50%),并且其编码产物具有相同或相似生理功能的一组结构基因。基因簇:是指基因家族中的各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域。