《基因组概论讲稿.ppt》由会员分享,可在线阅读,更多相关《基因组概论讲稿.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、全国高等学校医学规划教材全国高等学校医学规划教材全国高等学校医学规划教材全国高等学校医学规划教材 分子诊断学分子诊断学分子诊断学分子诊断学关于基因组概论第一页,讲稿共二十九页哦第一节第一节 基因组的功能单位基因组的功能单位基因基因n早期的基因概念早期的基因概念nMorgan等把遗传性状与特定的染色体区段联等把遗传性状与特定的染色体区段联系起来,并提出系起来,并提出“一个基因,一个酶一个基因,一个酶”和和“一一个基因,一条多肽链个基因,一条多肽链”的概念。的概念。n分子生物学的基因概念分子生物学的基因概念n基因是一段携带功能产物(多肽,蛋白质,基因是一段携带功能产物(多肽,蛋白质,tRNA和和r
2、RNA和某些小分子和某些小分子RNA)信息的)信息的DNA片段,是控制某种性状的的遗传单位。片段,是控制某种性状的的遗传单位。一、基因一、基因(gene)的概念的概念:第二页,讲稿共二十九页哦三大特点:三大特点:n自我复制(半保留复制):自我复制(半保留复制):是生物得以繁衍,保证物种稳定,是生物得以繁衍,保证物种稳定,保持生物的基本特征。保持生物的基本特征。n基因决定性状:基因决定性状:n能够突变能够突变基因的特点基因的特点第三页,讲稿共二十九页哦蛋白蛋白/酶酶第四页,讲稿共二十九页哦l能够突变能够突变致死突变致死突变非致死突变非致死突变物种进化物种进化致病突变致病突变新物种新物种遗传病遗传
3、病第五页,讲稿共二十九页哦此外,此外,n不同物种,其基因大小不同。不同物种,其基因大小不同。总的来说,低等生物的基因小,总的来说,低等生物的基因小,高等生物的基因(通常含大量的内含子或重复序列)大。即使在同一生物内,不同基因高等生物的基因(通常含大量的内含子或重复序列)大。即使在同一生物内,不同基因大小不同。大小不同。n原核生物:原核生物:基因数目少,结构简单、紧凑,常具有操纵子结构,序列利用效率高,易基因数目少,结构简单、紧凑,常具有操纵子结构,序列利用效率高,易突变,大多为多顺反子。突变,大多为多顺反子。n真核生物:真核生物:基因数目很多,结构复杂,常含重复序列和非编码序列,机制复杂,相对
4、稳定,基因数目很多,结构复杂,常含重复序列和非编码序列,机制复杂,相对稳定,大多为单顺反子。大多为单顺反子。第六页,讲稿共二十九页哦基因的鉴别标准基因的鉴别标准 编码编码tRNA和和rRNA和某些小分子和某些小分子RNA的基因的基因:我们较易通过核酸序列加以判断。我们较易通过核酸序列加以判断。蛋白质编码基因蛋白质编码基因:目前可根据其特点使用五项标准来鉴别目前可根据其特点使用五项标准来鉴别 但这些标准使用起来却并不得心应手。但这些标准使用起来却并不得心应手。第七页,讲稿共二十九页哦 1.开放阅读框(开放阅读框(open reading frame,ORF)*始于起始密码子并终于终止密码子的一串
5、密码子。始于起始密码子并终于终止密码子的一串密码子。*从从mRNA中找出大的中找出大的ORF来确定编码蛋白质的基因来确定编码蛋白质的基因;*适合于从适合于从DNA序列中鉴别原核生物基因和含少量内含子序列中鉴别原核生物基因和含少量内含子的真核基因。的真核基因。*但对于一些短少的基因及一些内含子丰富的基因则很难鉴但对于一些短少的基因及一些内含子丰富的基因则很难鉴别。别。基因基因基因组基因组DNA启动启动子等子等5非编非编码区码区3非编非编码区码区ATG 编码区编码区 TAAORF第八页,讲稿共二十九页哦2.序列特征序列特征密码子偏爱和剪接点密码子偏爱和剪接点*密码子偏爱(密码子偏爱(codon b
6、ias)指在不同物种的基因中经常为某种氨基酸编码的只是指在不同物种的基因中经常为某种氨基酸编码的只是其中的一个密码子。其中的一个密码子。当鉴别到一个当鉴别到一个ORF时,密码子偏爱常常用来确定这个时,密码子偏爱常常用来确定这个ORF是否是一个基因。是否是一个基因。*基因的剪接位点(基因的剪接位点(splice sites)一般有特定的序列特征,计算机程序利用这种序列一般有特定的序列特征,计算机程序利用这种序列特征可预测将近特征可预测将近50%的外显子及的外显子及20%的完整基因。的完整基因。第九页,讲稿共二十九页哦3.序列保守性序列保守性*一个功能在不同物种内是保守的基因,大都表现出外一个功能
7、在不同物种内是保守的基因,大都表现出外显子的保守性和内含子的多变性。显子的保守性和内含子的多变性。*最好是对适当进化距离的物种间序列进行比较。最好是对适当进化距离的物种间序列进行比较。*但保守性序列也可能是非转录的调控单元。但保守性序列也可能是非转录的调控单元。*寻找基因的表达产物寻找基因的表达产物RNA或蛋白质,是鉴定一个基或蛋白质,是鉴定一个基因的有效方法。因的有效方法。*但有些但有些OFR似乎并不转录,因为检测不到它们的似乎并不转录,因为检测不到它们的RNA或蛋白质产物。或蛋白质产物。4.转录产物转录产物第十页,讲稿共二十九页哦 除除以以上上鉴鉴定定基基因因的的五五项项标标准准之之外外,
8、在在实实施施过过程程中中还还有有些些麻烦的问题,如重叠基因、变通性断裂基因、假基因等。麻烦的问题,如重叠基因、变通性断裂基因、假基因等。*使基因失活也是确认基因功能的一个方法。使基因失活也是确认基因功能的一个方法。*但许多编码序列的失活并不导致一个明显的表型,因而很难但许多编码序列的失活并不导致一个明显的表型,因而很难找到鉴定的标准。找到鉴定的标准。5.基因失活基因失活第十一页,讲稿共二十九页哦第二节第二节 基因组基因组基因组(基因组(genome)是指一个细胞或生物体的一套完整是指一个细胞或生物体的一套完整的单倍体遗传物质。的单倍体遗传物质。对二倍体高等生物来说,维持配子正常功能最低数对二倍
9、体高等生物来说,维持配子正常功能最低数目的一套染色体遗传物质,构成一套基因组。目的一套染色体遗传物质,构成一套基因组。原核生物和真核生物基因组又分染色体基因组与染原核生物和真核生物基因组又分染色体基因组与染色体外基因组,后者如原核生物的质粒色体外基因组,后者如原核生物的质粒DNA,真核生物,真核生物的线粒体的线粒体DNA及叶绿体及叶绿体DNA。人类基因组人类基因组24个染色体(个染色体(22+X+Y)约)约3.0109bp第十二页,讲稿共二十九页哦人类基因组人类基因组24个染色体(个染色体(22+X+Y)约)约3.0109bp第十三页,讲稿共二十九页哦1.基因组大小与基因组大小与C值佯谬值佯谬
10、 n基因组大小在不同生物之间差异很大;基因组大小在不同生物之间差异很大;如如HBV 仅仅3200 bp,而某些显花植物和两栖类动物可达,而某些显花植物和两栖类动物可达1011bp。n基因组大小用基因组大小用C C值(值(C valueC value)表示;)表示;nC值大小基本上反映生物进化程度的差异;值大小基本上反映生物进化程度的差异;n但这种相关性并不很精确;但这种相关性并不很精确;n这种生物体的进化程度与基因组大小之间不完全成比例的这种生物体的进化程度与基因组大小之间不完全成比例的现象称为现象称为C值佯谬(值佯谬(C value paradox););nC值矛盾主要是由于各种生物基因组的
11、结构特征的差异造值矛盾主要是由于各种生物基因组的结构特征的差异造成的,低等和高等生物差别明显。成的,低等和高等生物差别明显。第十四页,讲稿共二十九页哦C值值(C-value):):单倍体基因组中的全部单倍体基因组中的全部DNADNA量量(bpbp)106 107 108 109 1010 1011显花植物骨鱼类哺乳类甲壳类爬行类鸟类藻类真菌革兰氏阳性菌革兰氏阴性菌枝原体霉菌蠕虫类软体动物棘皮类昆虫类软骨鱼类两栖类第十五页,讲稿共二十九页哦2.基因总数与基因总数与N值佯谬值佯谬 n基因总数(基因总数(N表示)表示)n人类为人类为3万多个,仅比大肠杆菌大万多个,仅比大肠杆菌大7倍,比低倍,比低等动
12、物秀丽线虫大等动物秀丽线虫大1.6倍,水稻高达倍,水稻高达5万。万。n果蝇在进化上比秀丽线虫高等,基因总数只果蝇在进化上比秀丽线虫高等,基因总数只有后者的有后者的0.6倍。倍。n基因组中基因数目与生物进化程度或复杂程基因组中基因数目与生物进化程度或复杂程度的不对称性,称为度的不对称性,称为N值佯谬(值佯谬(N-value paradox)。)。第十六页,讲稿共二十九页哦基因总数与基因总数与N值佯谬值佯谬 第十七页,讲稿共二十九页哦n既然一切生物性状都是由基因决定的,那么既然一切生物性状都是由基因决定的,那么生物体的生物体的DNA含量(含量(C值)和质量(值)和质量(N值)值)就应该与生物进化阶
13、梯及复杂性成正相关。就应该与生物进化阶梯及复杂性成正相关。n生物体结构与功能的复杂程度不仅取决于一生物体结构与功能的复杂程度不仅取决于一定的基因数量,更重要的是在于定的基因数量,更重要的是在于基因功能及基因功能及其相互作用网络的复杂性和精确性其相互作用网络的复杂性和精确性。第十八页,讲稿共二十九页哦第三节第三节 基因组计划基因组计划 (genome project)n基基因因组组计计划划是是指指以以获获得得某某物物种种基基因因组组全全序序列列为为主主要目标的科学计划。要目标的科学计划。n如如 人人 类类 基基 因因 组组 计计 划划(human genome project,HGP),小小鼠鼠
14、基基因因组组计计划划,家家狗狗基基因因组计划,细菌基因组计划等。组计划,细菌基因组计划等。第十九页,讲稿共二十九页哦 第二十页,讲稿共二十九页哦一、修正后的一、修正后的HGP主要内容主要内容HGP主要任主要任务务及内容及内容主要任务 内容物理物理图图 确定染色体确定染色体DNA上上诸诸如限制性内切如限制性内切酶酶识别识别 位点,或序列位点,或序列标标志点(志点(STSs)等的位置)等的位置图图遗传图遗传图 确定确定标标志位点在染色体志位点在染色体DNA上的上的线线性排列性排列 顺顺序。序。标标志位点志位点间间的的图图距以距以遗传遗传学(重学(重组组 )距离表示、)距离表示、单单位位为为厘摩厘摩
15、尔尔根(根(cM)序列序列图图 测测定人定人类类24条染色体的、由条染色体的、由3103109 9个核苷个核苷 酸酸组组成的全部成的全部DNADNA序列,序列,绘绘制人制人类类基因基因组组序序 列列图谱图谱第二十一页,讲稿共二十九页哦HGP的研究进程的研究进程nDulbecco(1986)首次提出)首次提出HGP的概念,的概念,1990美国美国国会批准正式启动。国会批准正式启动。n 1995年以年以STS为标志的物理图谱问世,其分辨率为为标志的物理图谱问世,其分辨率为200bp、覆盖率高达、覆盖率高达94%;n同年,汇集了人类基因组初步的全物理图,同年,汇集了人类基因组初步的全物理图,3、12
16、、16、22号染色体高密度物理图,以及号染色体高密度物理图,以及30余万个左右余万个左右cDNA(EST)序列信息;)序列信息;n由于卫星多态性标志的应用,遗传制图已于由于卫星多态性标志的应用,遗传制图已于1994年年提前完成,确定的全部标志密度为提前完成,确定的全部标志密度为0.7cM,含,含5826个个转座子,大小为转座子,大小为4000cM的线性遗传图;的线性遗传图;第二十二页,讲稿共二十九页哦n1994年人类基因组遗传图谱发表。年人类基因组遗传图谱发表。n人类基因组工作框架已于人类基因组工作框架已于2000年年6月由人类月由人类基因组计划国际合作组完成。基因组计划国际合作组完成。n在此
17、基础上经整理、分类和排列后,人类基在此基础上经整理、分类和排列后,人类基因组图谱及其初步分析结果于因组图谱及其初步分析结果于2001年年2月月12日正式公布。日正式公布。n2004年年10月发表了人类基因组常染色质全月发表了人类基因组常染色质全序列,(人类基因组的常染色质部分中)其序列,(人类基因组的常染色质部分中)其中中99%的序列已被确定,其精度达到每的序列已被确定,其精度达到每10万个碱基中只有一个测量误差。万个碱基中只有一个测量误差。第二十三页,讲稿共二十九页哦其他基因组计划其他基因组计划n微生物基因组计划和人类基因组计划分别于微生物基因组计划和人类基因组计划分别于1986年年和和19
18、90年启动,年启动,n其后又启动了各种其后又启动了各种模式生物(模式生物(model organisms)基基因组计划(如线虫、果蝇、小鼠等),因组计划(如线虫、果蝇、小鼠等),n致病生物体基因组计划,致病生物体基因组计划,n环境相关基因组计划,环境相关基因组计划,n以及具有重要经济价值的动植物基因组计划等。以及具有重要经济价值的动植物基因组计划等。n到目前为止已经完成了数百种生物体的基因组测序工作。到目前为止已经完成了数百种生物体的基因组测序工作。第二十四页,讲稿共二十九页哦第四节第四节 基因组学基因组学n基因组学(基因组学(Genomics)n指对所有基因进行基因组作图(包括遗传图谱、指对
19、所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱,核苷酸序列分析,基因物理图谱、转录图谱,核苷酸序列分析,基因定位和基因功能分析的一门科学。定位和基因功能分析的一门科学。n基因组学研究包括两亚领域基因组学研究包括两亚领域n以全基因组测序为目标的以全基因组测序为目标的结构基因组学结构基因组学(structural genomics)n以基因功能鉴定为目标的以基因功能鉴定为目标的功能基因组学功能基因组学(functional genomics)又称为又称为后基因组学后基因组学(postgenome)研究。研究。第二十五页,讲稿共二十九页哦后基因组计划后基因组计划n21世纪生物学的发展方向世
20、纪生物学的发展方向功能基因组学功能基因组学n对整个基因组所包含的基因、非基因序列的功能对整个基因组所包含的基因、非基因序列的功能进行大规模分析;认识基因在发育、分化和病理进行大规模分析;认识基因在发育、分化和病理状态下的功能变化及其调节机制。状态下的功能变化及其调节机制。n后基因组时代的主角后基因组时代的主角蛋白质组学蛋白质组学n蛋白质组蛋白质组(proteome)是指细胞或组织表达的全是指细胞或组织表达的全部蛋白质。部蛋白质。n人类人类2.4万个基因,几十万种蛋白质;万个基因,几十万种蛋白质;n重点分析生命不同时期、不同组织、不同(疾病)重点分析生命不同时期、不同组织、不同(疾病)状态蛋白质
21、的变化状态蛋白质的变化n蛋白质组学蛋白质组学(proteomics):是从整体上采取高通是从整体上采取高通量量/大规模手段研究所有蛋白组成及其活动规律大规模手段研究所有蛋白组成及其活动规律.第二十六页,讲稿共二十九页哦n基因组学的延伸基因组学的延伸模式生物基因组学模式生物基因组学n五大模式生物:五大模式生物:E.coli、酿酒酵母、黑腹果蝇、秀丽线虫和小鼠,、酿酒酵母、黑腹果蝇、秀丽线虫和小鼠,其序列分析被列为其序列分析被列为HGP的内容;的内容;n不同物种间功能基因有相当大保守性,如不同物种间功能基因有相当大保守性,如99%鼠基因与人对应;鼠基因与人对应;n最终目的:比较基因组学最终目的:比
22、较基因组学比较不同物种的全基因组,增强比较不同物种的全基因组,增强对各基因功能的认识。对各基因功能的认识。n从分子水平上升到细胞水平从分子水平上升到细胞水平细胞计划细胞计划n在阐明以基因为核心的生命物质的本质后,以信号传导为主线在阐明以基因为核心的生命物质的本质后,以信号传导为主线阐明在细胞内一切生命现象的本质。阐明在细胞内一切生命现象的本质。n1950年代生物学从细胞水平深入到分子水平是一次飞跃,但现在年代生物学从细胞水平深入到分子水平是一次飞跃,但现在似乎又正返回到细胞水平!似乎又正返回到细胞水平!n新型学科与产业的发展新型学科与产业的发展生物信息学和生物芯片生物信息学和生物芯片第二十七页,讲稿共二十九页哦基基因因组组与与蛋蛋白白质质组组知知识识 库库 基因组科学与医学的关系基因组科学与医学的关系药物基药物基因组学因组学疾病分疾病分子机制子机制药物研制产业化产业化基因治疗基因治疗遗传背遗传背景对环景对环境和疾境和疾病的易病的易感性感性个体化预个体化预防医学防医学个体化治疗个体化治疗分分子子诊诊断断第二十八页,讲稿共二十九页哦感谢大家观看第二十九页,讲稿共二十九页哦