《DNA二级结构.doc》由会员分享,可在线阅读,更多相关《DNA二级结构.doc(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流DNA二级结构.精品文档.DNA 的 二 级 结 构 DNA双螺旋结构的主要依据 DNA双螺旋结构的要点 DNA双螺旋结构与DNA复制 1944年Avery等的重要发现,首次严密地证实了DNA就是遗传物质的事实。 随后,一些研究逐步肯定了核酸作为遗传物质在生物界的普遍意义。至50年代初, 已经对DNA和RNA中的化学成分, 碱基的比例关系及核苷酸之间的连接键等重要问题有了明确的认识。在此背景下, 研究者们面临着一个揭示生命奥秘的十分关键且诱人的命题:作为遗传载体的DNA分子,应该具有怎样的结构?1953年,Watson和Crick以非凡的洞察
2、力, 得出了正确的答案。 他们以立体化学上的最适构型建立了一个与DNA X射线衍射资料相符的分子模型-DNA双螺旋结构模型。 这是一个能够在分子水平上阐述遗传(基因复制)的基本特征的DNA二级结构。 它使长期以来神秘的基因成为了真实的分子实体,是分子遗传学诞生的标志,并且开拓了分子生物学发展的未来。DNA双螺旋结构的主要依据:50年代初的核酸研究现状已经使人们普遍接受了这样的观点:多核苷酸的特定序列是遗传信息所在。 尽管当时还没有任何能直接说明这一点及其它基因作用原理的实验依据,但这一概念无疑对设想DNA结构是非常重要的。可以说,Watson和Crick提出的模型是在人们意识到核酸重要性的历史
3、条件下,集各项DNA研究成果于一体的产物。但对建立DNA 双螺旋结构有直接影响的主要是以下两方面的依据:(1)Chatgaff 对DNA碱基组成的研究结果:1949-1951年间,Chatgaff应用紫外分光光度法结合纸层析等技术,对不同来源的DNA进行了碱基定量分析, 得出了组成DNA的四种碱基的比例关系(见下表)。从中可发现碱基组成的下列共同规律:(1)以摩尔含量表示,不同来源的DNA都存在着这种关系,即A=T和C=G;(2) 不同物种组织DNA在总的碱基组成上有很大的变化,表现在A+T/G+C比值的不同, 但同种生物的不同组织DNA碱基组成相同;(3)嘌呤碱基的总和与嘧啶碱基的总和相等。
4、 这些发现不仅为DNA能携带遗传信息的论点提供了依据,而且为DNA 结构模型中的碱基配对原则奠定了基础。 DNA 来源腺嘌呤胸腺嘧啶鸟嘌呤胞嘧啶(A+T) /(G+C)大肠杆菌25.424.8 24.125.71.01小麦26.828.023.222.71.21鼠29.725.621.922,81.21猪:肝胸腺脾29.430.029.629.728.929.220.520.420.420.520.720.81.43酵母31.332.918.717.11.079(2)Wilkins及其同事Franklin等用X射线衍射方法获得的DNA结构资料:X射线衍射技术是一种在原子水平上间接观测晶体物质的
5、分子结构的方法。这个研究小组制备的高度定向的DNA纤维晶体能够得到精确反映DNA某些结构特征的X 射线衍射图片,其影像表明了DNA结构的螺旋周期性,碱基的空间取向等。这些资料对Watson和Crick构建DNA双螺旋结构模型起了关键性作用。DNA双螺旋结构的要点(1)主链(backbone):由脱氧核糖和磷酸基通过酯键交替连接而成。主链有二条,它们似麻花状绕一共同轴心以右手方向盘旋, 相互平行而走向相反形成双螺旋构型。主链处于螺旋的外则,这正好解释了由糖和磷酸构成的主链的亲水性。 所谓双螺旋就是针对二条主链的形状而言的。(2)碱基对(base pair):碱基位于螺旋的内则,它们以垂直于螺旋轴
6、的取向通过糖苷键与主链糖基相连。同一平面的碱基在二条主链间形成碱基对。配对碱基总是A与T和G与C。碱基对以氢键维系,A与T 间形成两个氢键。 DNA结构中的碱基对与Chatgaff的发现正好相符。从立体化学的角度看,只有嘌呤与嘧啶间配对才能满足螺旋对于碱基对空间的要求, 而这二种碱基对的几何大小又十分相近,具备了形成氢键的适宜键长和键角条件。 每对碱基处于各自自身的平面上,但螺旋周期内的各碱基对平面的取向均不同。碱基对具有二次旋转对称性的特征,即碱基旋转180并不影响双螺旋的对称性。 也就是说双螺旋结构在满足二条链碱基互补的前提下,DNA的一级结构产并不受限制。这一特征能很好的阐明DNA作为遗
7、传信息载体在生物界的普遍意义。(3)大沟和小沟:大沟和小沟分别指双螺旋表面凹下去的较大沟槽和较小沟槽。小沟位于双螺旋的互补链之间,而大沟位于相毗邻的双股之间。这是由于连接于两条主链糖基上的配对碱基并非直接相对, 从而使得在主链间沿螺旋形成空隙不等的大沟和小沟。 在大沟和小沟内的碱基对中的N 和O 原子朝向分子表面。(4)结构参数:螺旋直径2nm;螺旋周期包含10对碱基;螺距3.4nm;相邻碱基对平面的间距0.34nm。DNA双螺旋结构与DNA复制:双螺旋结构模型的成功之处除与X 射线衍射图谱及核酸化学的研究资料相符外,另一个重要方面是它能够圆满地解释作为遗传功能分子的DNA是如何进行复制的。W
8、atson和Crick 这样设想DNA结构中的二条链看成是一对互补的模板(亲本),复制时碱基对间的氢键断开,两条链分开, 每条链都作为模板指导合成与自身互补的新链(复本),最后从原有的两条链得到两对链而完成复制。在严格碱基配对基础上的互补合成保证了复制的高度保真性, 也就是将亲链的碱基序列复制给了子链。因为复制得到的每对链中只有一条链是亲链, 即保留了一半亲链,故这种复制方式又称为半保留复制(semi-conservative replication)。双螺旋结构建立时,复制原理只是设想,不久这一设想被实验证实是正确的。现已明确:半保留复制是生物体遗传信息传递的最基本方式。DNA结构的多态性a
9、tson和Crick所推导出来的DNA结构在生物学研究中有深远意义。他们是以在生理盐溶液中抽出的DNA纤维在92相对温度下进行X射线衍射图谱为依据进行推设的。在这一条件下得出的DNA称B构象。实际上在溶液中的DNA的确呈这一构象,这也是最常见的DNA构象。但是,研究表明DNA的结构是动态的。在以钠、钾或铯作反离子,相对温度为75时,DNA分子的X射线衍射图给出的是A构象。这一构象不仅出现于脱水DNA中,还出现在RNA分子中的双螺旋区域的DNARNA杂交分子中。如果以锂作反离子,相对温度进一步降为66,则DNA是C构象。但是这一构象仅在实验室中观察到,还未在生物体中发现。这些DNA分子中G-C碱
10、基对较少,这些分子将取D和E构象。这些研究表明DNA的分子结构不是一成不变的,在不同的条件下可以有所不同。但是,这些不同构象的DNA都有共同的一点,即它们都是右手双螺旋;两条反向平行的核苷酸链通过atson-Crick碱基配对结合在一起;链的重复单位是单核苷酸;这些螺旋中都有两个螺旋沟,分为大沟与小沟,只是它们的宽窄和深浅程度有所不同。但是,Wang和Rich等人在研究人工合成的CGCGCG单晶的X射线衍射图谱时分别发现这种六聚体的构象与上面讲到的完全不同。它是左手双螺旋,在主链中各个磷酸根呈锯齿状排列,有如“之”字形一样,因此叫它Z构象(英文字Zigzag的第一个字母)。还有,这一构象中的重
11、复单位是二核苷酸而不是单核苷酸;而且ZDNA只有一个螺旋沟,它相当于B构象中的小沟,它狭而深,大沟则不复存在。立即就有几个问题被提了出来:这种结构是怎样生成的?这一结构在天然状态下存在吗?它有什么生物学意义?研究表明,ZDNA的形成是DNA单链上出现嘌呤与嘧啶交替排列所成的。比如CGCGCGCG或者CACACACA。这种碱基排列方式会造成核苷酸的糖苷键的顺式和反式构象的交替存在。当碱基与糖构成反式结构时,它们之间离得远;而当它们成顺式时,就彼此接近。嘧啶糖苷键通常是反式的,而嘌呤糖苷酸键既可成顺式的也可成反式的。而在ZDNA中,嘌呤碱是顺式的。这样,在ZDNA中嘧啶的糖苷链离开小沟向外挑出,而
12、嘌呤上的糖苷键则弯向小沟。嘌呤与嘧啶的交替排列就使得糖苷键也是顺式与反式交替排列,从而使ZDNA主链呈锯齿状或“之”字形。人们相信,并用实验证明细胞DNA分子中确实存在有ZDNA区。而且,细胞内有一些因素可以促使BDNA转变为ZDNA。比如,胞嘧啶第五位碳原子的甲基化,在甲基周围形成局部的疏水区。这一区域扩伸到BDNA的大沟中,使BDNA不稳定而转变为ZDNA。这种C5甲基化现象在真核生物中是常见的。因此在生物B构象的DNA中某些区段具有ZDNA构象是可能的。DNA真是一个构象可变动态分子。ZDNA有会么生物学意义呢?应当指出ZDNA的形成通常在热力学上是不利的。因为ZDNA中带负电荷的磷酸根
13、距离太近了,这会产物静电排斥。但是,DNA链的局部不稳定区的存在就成为潜在的解链位点。DNA解螺旋却是DNA复制和转录等过程中必要的环节,因此认为这一结构位点与基因调节有关。比如40增强子区中就有这种结构,又如鼠类微小病毒复制区起始点附近有GC交替排列序列。此外,DNA螺旋上沟的特征在其信息表达过程中起关键作用。调控蛋白都是通过其分子上特定的氨基酸侧链与DNA双螺旋沟中的碱基对一侧的氢原子供体或受体相互作用,形成氢键从而识别DNA上的遗传信息的。大沟所带的遗传信息比小沟多。沟的宽窄和深浅也直接影响到调控蛋白质对DNA信息的识别。ZDNA中大沟消失,小沟狭而深,使调探蛋白识别方式也发生变化。这些
14、都暗示ZDNA的存在不仅仅是由于DNA中出现嘌呤啶嘧交替排列之结果,也一定是在漫漫的进化长河中对DNA序列与结构不断调整与筛选的结果,有其内在而深刻的含意,只是人们还未充分认识而已。DNA构象的可变性,或者说DNA二级结构的多态性的发现拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿态来实现其丰富多采的生物的奥妙,也让人们在这一领域中探索和攀越时减少疲劳和厌倦,乐而忘返,从而有更多更新的发现。多年来,DNA结构的研究手段主要是X射线衍线技术,其结果是通过间接观测多个DNA分子有关结构参数的平均值而获得的。同时,这项技术的样品分析条件使被测DNA分子与天然状态相差甚远。因此,
15、在反映DNA结构真实性方面这种方法存在着缺陷。1989年,应用扫描隧道显微镜(STM)研究DNA结构克服了上述技术的缺陷。这种先进的显微技术,不仅可将被测物放大500万倍,且能直接观测接近天然条件下单个DNA分子的结构细节。应该说它所取得的DNA结构资料更具有权威性。表1-6是STM测到的B-DNA结构参数及其与X射线衍线资料的比较结果。STM研究还证实了d(CG)重复序列的寡核苷酸片段为Z-DNA结构的事实。STM技术的应用是DNA结构研究中的重要进展,可望在探索DNA结构的某些未知点上展示巨大潜力。B-DNA与Z-DNA的比较比较内容B-DNAZ-DNA螺旋手性右旋左旋螺旋周期的核苷酸数目
16、1012螺旋直径20A18A碱基平面的间距3.4A3.7A螺距34A45A相邻碱基对间的转角36A60A轴心与碱基的关系穿过碱基对不穿过碱基对B-DNA结构参数性质X射线衍射分析STM分析螺旋的手性右旋右旋螺旋的旋转周期33.8A*34.4+2A(32-36A)大沟宽度11.7A*间距:22.6A深度8.5A7A小沟宽度5.7A间距:12A深度7.5A2A大沟和小沟有关值的比较宽度比2.2间距比1.88*7个螺旋周期的DNA得以量度,表中值+-标准差。*间距指DNA双螺旋的高脊之间的距离,在含义上与宽度和深度有所不同。核酸的变性和复性 DNA的变性 DNA的复性 核酸分子杂交 变性(denat
17、uration)和复性(renaturation) 是双链核酸分子的二个重要物理特性。也是核酸研究中经常引用的术语。双链DNA,RNA双链区,DNA: RNA杂种双链(hybrid duplex)以及其它异源双链核酸分子(heteroduplex) 都具有此性质。(1)DNA的变性:指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。确切地就是维持双螺旋稳定性的氢键和疏水键的断裂。断裂可以是部分的或全部的,是可逆的或是非可逆的。DNA变性不涉及到其一级结构的改变。凡能破坏双螺旋稳定性的因素都可以成为变性的条件,如加热、极端的pH、有机试剂甲醇、乙醇、尿素及甲酰胺等,均可破坏双螺旋结构引起
18、核酸分子变性。变性能导致DNA 以下一些理化及生物学性质的改变。溶液粘度降低。DNA双螺旋是紧密的刚性结构,变性后代之以“柔软” 而松散的无规则单股线性结构,DNA粘度因此而明显下降。溶液旋光性发生改变。变性后整个DNA分子的对称性及分子局部的构性改变, 使DNA溶液的旋光性发生变化。增色效应或高色效应(hyperchromic effect)。指变性后DNA 溶液的紫外吸收作用增强的效应。DNA分子具有吸收250280nm波长的紫外光的特性,其吸收峰值在260nm。DNA分子中碱基间电子的相互作用是紫外吸收的结构基础,但双螺旋结构有序堆积的碱基又束缚了这种作用。变 性DNA 的双链解开,碱基
19、中电子的相互作用更有利于紫外吸收,故而产生增色效应。一般以260nm下的紫外吸收光密度作为观测此效应的指标,变性后该指标的观测值通常较变性前有明显增加, 但不同来源DNA的变化不一,如大肠杆菌DNA经热变性后,其260nm的光密度值可增加40%以上, 其它不同来源的DNA溶液的增值范围多在2030%之间。以加热为变性条件时,增色效应与温度有十分密切的关系,这主要是变性温度取决于DNA自身的性质。热变性使DNA分子双链解开所需温度称为熔解温度( melting temperature,简写Tm)。因热变性是在很狭的温度范围内突发的跃变过程, 很像结晶达到熔点时的熔化现象,故名熔解温度。若以温度对
20、DNA溶液的紫外吸光率作图,得到的典型DNA变性曲线呈S型。S型曲线下方平坦段,表示DNA的氢键未被破坏,待加热到某一温度处时,次级键突发断开,DNA迅速解链,同时伴随吸光率急剧上升,此后因无链可解而出现温度效应丧失的上方平坦段。Tm定义中包含了使被测DNA的50%发生变性的意义,即增色效应达到一半的温度作为Tm,它在S型曲线上,相当于吸光率增加的中点处所对应的横坐标。不同来源DNA间的Tm存在差别,在溶剂相同的前提下,这种差别主要是由DNA本身下列两方面的性质所造成的。(1)DNA的均一性。有二种含义,首先是指DNA分子中碱基组成的均一性,如人工合成的只含有一种碱基对的多核苷酸片段,与天然D
21、NA比较,其Tm值范围就较窄。因前者在变性时的氢链断裂几乎可齐同进行,故所要求的变性温度更趋于一致。其次还包含有待测样品DNA的组成是否均一的意思,如样品中只含有一种病毒DNA,其Tm值范围较窄, 若混杂有其它来源的DNA,则Tm值范围较宽。其原因显然也与DNA的碱基组成有关。 总的说,DNA均一性,变性的DNA链各部分的氢键断裂所需能量较接近,Tm值范围较窄,反之亦然。(2)DNA的(G+C)含量。在溶剂固定的前提下,Tm值的高低取决于DNA分子中的(G+C)的含量。(G+C)含量越高,即G-C碱基对越多,Tm值越高。此点是易于理解的,因G-C碱基对具有3对氢键,而A-T碱基对只有2对氢键,
22、DNA中(G+C)含量高显然更能增强结构的稳定性,破坏G-C间氢键需比A-T氢键付出更多的能量,故(G+C)含量高的DNA,其变性Tm也高。实验说明,Tm与DNA中(G+C)含量存在着密切相关性(图1-16),从中可看出,变性温度受到溶液离子强度的影响。Tm与(G+C)含量(X)百分数的这种关系可用以下经验公式表示(DNA溶于0.2mol/L NaCl中):X%(G+C)=2.44(Tm-69.3)(2)DNA的复性:指变性DNA 在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。热变性DNA一般经缓慢冷却后即可复性,此过程称之为 退火(annealing)
23、。这一术语也用以描述杂交核酸分子的形成(见后)。DNA的复性不仅受温度影响,还受DNA自身特性等其它因素的影响。以下简要说明之。温度和时间。变性DNA溶液在比Tm低25的温度下维持一段长时间,其吸光率会逐渐降低。将此DNA再加热,其变性曲线特征可以基本恢复到第一次变性曲线的图形。这表明复性是相当理想的。一般认为比Tm低25左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。在很低的温度(如4以下)下,分子的热运动显著减弱互补链结合的机会自然大大减少。从热运动的角度考虑,维持在Tm以下较高温度,更有利于复性。复性时温度下降必须是一缓慢过程,若在超过Tm的温度下迅速冷却至低温(如4以下),复
24、性几乎是及不可能的,核酸实验中经常以此方式保持DNA的变性(单链)状态。这说明降温时间太短以及温差大均不利于复性。DNA浓度。复性的第一步是两个单链分子间的相互作用“成核”。这一过程进行的速度与DNA浓度的平方成正比。即溶液中DNA分子越多,相互碰撞结合“成核”的机会越大。DNA顺序的复杂性。简单顺序的DNA分子,如多聚(A)和多聚(U)这二种单链序列复性时,互补碱基的配对较易实现。而顺序复杂的DNA,如小牛DNA的非重复部分,一般以单拷贝存在于基因组中,这种复杂特定序列要实现互补,显然要比上述简单序列困难得多。在核酸复性研究中,定义了一个Cot的术语,(Co为单链DNA的起始浓度,t是以秒为
25、单位的时间),用以表示复性速度与DNA 顺序复杂性的关系。在探讨DNA顺序对复性速度的影响时,将温度、溶剂离子强度、核酸片段大小等其它影响因素均予以固定,以不同程度的核酸分子重缔合部分(在时间t时的复性率)取对数后对Cot作图,可以得到如图所示的曲线,用非重复碱基对数表示核酸分子的复杂性。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105核苷对的非重复DNA的复杂性为105。原核生物基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接与基因组大小成正比,对于真核生物基因组中的非重复片段也是如此。在标准条件下(一般为0.18ml/L阳离子浓度,400核苷
26、酸的长的片段)测得的复性率达0.5时的Cot值(称Cotl/2),与核苷酸对的复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复序列(repetitive sequence),所得到的Cot曲线要上图中的S曲线复杂。(3)核酸分子杂交:分子杂交(简称杂交,hybridization)是核酸研究中一项最基本的实验技术。其基本原理就是应用核酸分子的变性和复性的性质,使来源不同的DNA(或RNA)片段,按碱基互补关系形成杂交双链分子(heteroduplex)。杂交双链可以在DNA与DNA链之间,也可在RNA与DNA链之间形成
27、。杂交的本质就是在一定条件下使互补核酸链实现复性(加热或碱处理)使双螺旋解开成为单链,因此,变性技术也是核酸杂交的一个环节。若杂交的目的是识别靶DNA中的特异核苷酸序列,这需要牵涉到另一项核酸操作的基本技术探针(probe)的制备。探针是指带有某些标记物(如放射性同位素32P,荧光物质异硫氰酸荧光素等)的特异性核酸序列片段。若我们设法使一个核酸序列带上32P,那么它与靶序列互补形成的杂交双链,就会带有放射性。以适当方法接受来自杂交链的放射信号,即可对靶序列DNA的存在及其分子大小加以鉴别。在现代分子生物学实验中,探针的制备和使用是与分子杂交相辅相成的技术手段。核酸分子杂交作为一项基本技术,已应
28、用于核酸结构与功能研究的各个方面。在医学上,目前已用于多种遗传性疾病的基因诊断(gene diagnosis),恶性肿瘤的基因分析,传染病病原体的检测等领域中,其成果大大促进了现代医学的进步和发展。RNA生物合成概念RNA几乎总是单链的。但几乎每个RNA分子都有许多短的双螺旋部分,称为发夹。这是因为在发夹中,一条RNA链上的两个节段是反平行走向的,可形成碱基对而产生双螺旋区。此外,除了标准的GC和AU对之外,还有较弱的GU对可帮助形成单链RNA的二级结构,一条正在延伸的RNA链的二级结构影响这个RNA分子的剩下部分的转录状况一个细胞中含有许多不同的RNA子,其长度可从小至到50个核苷酸到大至数
29、万个核苷酸不等。这些几乎总是线性单链RNA分分子,极少有环状RNA分子。在细胞周期的某一阶段,DNA双链解开成为转录的模板。一切细胞均具有RNA聚合酶。E.coli细胞中约有RNA聚合酶分子3000个以上。此酶催化RNA主链中核苷酸间的3,5磷酸二酯键的形成。催化反应速度很快,在37时RNA链的延伸可达40个核苷酸/秒。但是这种催化作用必须有DNA(作为模板)的存在。RNA的合成一定要非常精确。然而不像DNA那样,转录作用并没有校正(proofreading)机制。但由于细胞RNA不能自我复制,故即使偶有差错亦不会遗传下去。双螺旋DNA分子中仅有一条链可作为RNA的模板。如果说,DNA分子中的
30、两条链均可作为RNA的模板,则每个基因势必将产生两条有互补顺序的RNA。然而遗传学证明每个基因只控制一个蛋白质,故实际上只合成了一条RNA链,或者即使合成两条RNA链,其中也只有一条有功能。事实上,在活体内,只存在着这两条可能RNA链中的一条。在枯草杆菌(Bacillus subtilis)中繁殖的病毒SP8的DNA中,两条互补链的碱基组成截然不同,或者比较容易地分离开来,因而有可能确定活体内的RNA的碱基顺序是否和两条(还是仅和一条)DNA互补。将双链DNA加热到接近100以使之变性,再加入用此DNA为模板所合成的单链RNA,再进行退火。结果除复性的DNA双螺旋外,还形成了DNA-RNA杂种
31、分子。实验的结果是很明确的,即仅有一条DNA链被转录。如果用RNA聚合酶在体外对DNA双螺旋进行转录,则结果取决于DNA模板受到损伤的程度。例如将T7DNA变性,使RNA聚合酶能与单链DNA结合,则两条均能被转录。但如果用天然的完整双链DNA为模板,则RNA聚合酶仅能和称为启动子的顺序结合,从而只能转录在活体内被转录的那条链。RNA聚合酶细菌的RNA聚合酶,像DNA聚合酶一样,具有很复杂的结构。其活性形式(全酶)为15S,由5种不同的多肽链构成,按分子量大小排列分别为(155000),(151000),(7000),(36500)和(11000)。每分子RNA聚合酶除有两个亚基外,其余亚基均只
32、有一个,故全酶为2(450000)(表3-1)。E.coli RNA聚合酶的亚基和转录因子基因名称基因图位置分多肽链分子量全酶中的数目功能RNA聚合酶的亚基rpoC89.51550001与DNA结合rpoB89.51510001聚合作用的催化位点rpoD66.5700001识别启动子,起始转录rpoA72365002?110001?转录因子rho84.5460006转录终止nusAnusA65690001转录延长,终止注:基因图位置是指传统的(环状)E.coli的遗传图谱如果全酶为球状,则可计算其直径约为100A,即约为双链DNA的30bp节段的长度。然而全酶可结合约60个核苷酸,提示其形状应
33、为椭圆球形。亚基和其他肽链的结合不很牢固。当亚基脱离全酶后,剩下的2称为核心酶。核心酶本身就能催化核苷酸间磷酸二酯键的形成,不论有无存在的利福平(rifampicin)和利福霉素(rifamycin)能结合在亚基上而对此酶发生强烈的抑制作用。它抑制RNA合成的起始而不抑制其延长。亚基的基因rpoB的突变可使细菌对利福平有抗性。而另一种抗生素链霉溶菌素(streptolydigin)能抑制RNA链的延长,rpoB的突变却可使细胞对链霉溶菌素亦发生抗性。总的看来亚基似乎是酶和核苷酸底物结合的部位。肝素能与DNA竞争与RNA聚合酶相结合。肝素是一种多价阴子,能和亚基结合,从而在体外抑制转录作用。可见
34、亚基的碱性较强,适于与模板DNA相结合。亚基的功能现尚未知。然而,当噬菌体T4感染E.coli时,其亚基即在精氨酸上被ADP-核糖化。这种修饰作用使该RNA聚合酶全酶对其原先识别的启动子的亲和力减弱。所以有人认为,亚基的功能可能是识别其相应的启动子。为什么细菌的RNA聚合酶需要这么大和复杂的分子结构呢?而某些噬菌体特有的RNA聚合酶则要小得多,仅由一条多肽链组成。这证明RNA合成所需的机构可以远比宿主的酶小。这种情况说明,噬菌体内的转录仅需一条最小的机构。然而这种酶只能识别噬菌体本身所有的少数几个启动子;它们不能识别其他启动子。例如噬菌体T3和T7的RNA聚合酶分子很相似,二者都不过是一条多肽
35、链,分子量约11000。它们能很快合成RNA。其速率在37时可达约200核苷酸/秒。相比之下,宿主细胞的RNA聚合酶却能转录细胞内的许多转录单位(1000个)中的任意一个。这些转录单位中有一些可由RNA聚合酶直接转录,不需要其他因子的帮助。但大多数这些转录单位仅在更多的蛋白质因子存在下才能被该RNA聚合酶所转录。所以,可以想像宿主细胞所以要求这样大和复杂,至少部分反映了它需要和许多其他因子相互作用,而不是其催化活性的固有的要求。Ecoli的RNA聚合酶各亚基的基因(除亚基的基因尚不详外)均存在于三个操纵子中,这些操纵子还含有蛋白质合成和DNA合成所需的基因。P71主要启动子(P)均在操纵子的左
36、侧,RNA则向右方合成。次要启动子(p)包括操纵子中的一个启动子(PHS,是在热休克条件下才有活性的启动子),均位于操纵子之内。这些次要启动子仅启动在其右侧的基因。操纵子的前面两个基因L11和L1,有时被认为组成另一个独立的操纵子,因为在L10基因之前另有一启动子。这些基因编码50个左右核糖体蛋白质中的某些蛋白质。操纵子中还含有复制所需的蛋白质,即DNA引物酶的基因。现在还不清楚这些操纵子是如何进行调节的。操纵子有两个连续的启动子,就像rRNA的操纵子一样。受到ppGpp分子的调控,故与生长速度有关。这些操纵子中的基因并不是相等地被转录的:在和操纵子开始中的核糖体蛋白质基因的后面有衰减子(at
37、tenuators),可使其后的RNA聚合酶基因的转录大为降低。因此,在每个细胞中RNA聚合酶亚基的数目(约3000个)要大大少于核糖体蛋白质的分子数(约20000个),这是符合细菌的需要的。然而令人不解的是DNA引物酶基因位于基因之前,然而在细胞内亚基的数目反而要比引物酶分子数多60倍(3000比50)。这可能是因为编码引物酶的mRNA节段要比其余mRNA部分不稳定得多。这些操纵子内都有几个次要的启动子,包括操纵子内的一个可被热休克所激活,说明实际的调控作用还要更为复杂得多。启动子亚基本身并无催化功能;它的作用是识别DNA分子上的起始信号。在体外实验中可见,在没有时,核心酶偶而亦能起始RNA
38、的合成,但有许多起始错误,而且核心酶所合成的RNA链的起始在某个基因的两条链上是随机的。但当存在时,则起始在正确的位点上,这说明全酶能够特异性地与启动子相结合。两类不同的启动子启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。在基因表达的调控中,转录的起始是个关键。常常某个基因是否应当表达决定于在特定的启动子起始过程。那末,在某一特定启动子起始转录时是由什么来控制的呢?启动子一般可分为两类:(1)一类是RNA聚合酶可以直接识别的启动子。这类启动子应当总是能被转录。但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使
39、聚合酶不能和启动子结合。(2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子的存在。这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA聚合酶的亲和力各不同。这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。DNA链上从启动子直到终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。启动子的共同顺序为什么RNA聚合酶能够仅在启动子
40、处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。-10序列又称为Pribnow盒(原核生物)。在真核生物中相应的序列位于-35bp处,称为TATA盒,又称为Goldberg-Hognessbox,是RNA聚合酶
41、的结合部位。-10和-35这两个部位都很重要:1RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;2离开共同顺序较远的启动子的活性亦较弱;3最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能感觉到每个结合区的沟底中碱基所产生的特异形状。原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可
42、能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶可以识别一顺序。近年来在对家兔珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔珠蛋白基因的转录水平降低。启动子中的10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例
43、如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的激活蛋白的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。RNA聚合酶与启动子的结合大肠杆菌的RNA聚合酶与启动子结合的过程可分为两步。1酶找到启动子顺序并与其以关闭复合体形式(即双螺旋形式)相
44、结合。这一步所识别的是-35序列,因为-35序列的突变损害启动子的结合。2关闭复合体转变为开放复合体(即双螺旋被解旋,两条链分开);此时酶的结合比较紧密。在这个转变中-10区约有17bp被解旋,暴露出模板链。-10序列富于AT碱基对,因为AT对比GC对更易于融化。-10区的突变可阻碍开放复合体的形成。许多突变改变了-10序列中的碱基,但并未减低其AT对的水平,却仍然能阻碍其融化为开放复合体,可见-10区除了要易于融化之外,还必须有特异的形状,以便RNA聚合酶能够识别它。不同启动子需要不同因子Ecoli细胞中主要的因子可与核心酶一同被纯化,称为70,但菌细胞中另外有一些因子能够识别其顺序与E.c
45、oli的主要启动子不同的另一些启动子,并促使核心酶起始转录。这些变异的因子在细胞中有特别功能,通常能剧烈改变细胞RNA的合成方式,以便在需要时使一组全新的基因得以表达。这是在枯草杆菌(Bacillus subtilis)中首次发现的,它们的作用是开启在芽胞形成(sporulation)过程中需要的一整套新的蛋白质的表达。噬菌体往往有其自己的因子,借以在噬菌体发育的某一特殊阶段开动其所需要的某些噬菌体基因的转录。在E.coli中共有17个热休克基因,基因表达有赖于转录改变。基因htpR是其主要调节器,是转到热休克反应所必需的。hrpR的产物是一个32KD的蛋白质,它就是一种变异的因子,称为32。
46、而将正常的因子称为70(表示其分子量为70KD)。然而32很不稳定,故调控它的表达状况就可以使其量迅速增多减少。32能引导核心酶在热休克基因的启动子处起始转录。这些启动子的顺序与正常的共同顺序是不同的。特别是其-10顺序几乎完全不同。E.coli的不同因子识别不同的共同顺序因子基因功用-35顺序间隔距离-10顺序70rpoD正常状态TTGACA10-18bpTATAAT32rpoH热休克CNCTTGAA13-15bpCCCCATNT60rpoN氮的利用CTGGNA6bpTTCGAE.coli的另一种因子是在氮饥饿时起作用的,称为60。正常时E.coli细胞中仅有少量60,但当介质中氨缺乏时,6
47、0即大量增多,以开启某些可利用其他氮源的基因。这就是说,60能引导核心酶识别启动子的另一种共同顺序。60所识别的-35顺序实际上位于-20处,因为-10和-35两个顺序之间的间距特别短,只有6bp(见表3-32)。枯草杆菌的正常因子(相当于E.coli中的70)称为43,。它能识别70所识别的共同顺序。从一组基因表达变换为另一组基因表达往往需要更换因子。这在噬菌体生命周期的裂解(lytic)期和溶源(lysogenic)期的转换中表现最为明显。在噬菌体SP01感染枯草杆菌时即会出现新的因子。SP01的感染周期一般可分为三期:1刚刚感染时,早期基因被转录。24-5分钟后早期基因转录停止,中期基因开始转录。38-12分钟后中期基因的转录又被晚期基因所取代。早期基因由宿主菌的全酶转录,故仍用43。而中