生物信息学 第5章 常用分析软件.ppt

上传人:s****8 文档编号:66157253 上传时间:2022-12-14 格式:PPT 页数:35 大小:618.50KB
返回 下载 相关 举报
生物信息学 第5章 常用分析软件.ppt_第1页
第1页 / 共35页
生物信息学 第5章 常用分析软件.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《生物信息学 第5章 常用分析软件.ppt》由会员分享,可在线阅读,更多相关《生物信息学 第5章 常用分析软件.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第5章 常用分析软件 一、基因结构一、基因结构 基因的概念是随着遗传学、分子生物学、基因的概念是随着遗传学、分子生物学、生物化学等领域的发展不断完善的。从分子生物化学等领域的发展不断完善的。从分子生物学角度来看,生物学角度来看,基因基因是负载特定生物遗传是负载特定生物遗传信息的信息的DNADNA分子片段,在一定的条件下能够分子片段,在一定的条件下能够表达这种遗传信息,产生特定的生理功能。表达这种遗传信息,产生特定的生理功能。原核生物基因结构:一个完整的原核基因结构是从基因的一个完整的原核基因结构是从基因的一个完整的原核基因结构是从基因的一个完整的原核基因结构是从基因的5555端启动子区域开端启

2、动子区域开端启动子区域开端启动子区域开始,到始,到始,到始,到3333端终止区域结束。基因的转录开始位置由转录起始端终止区域结束。基因的转录开始位置由转录起始端终止区域结束。基因的转录开始位置由转录起始端终止区域结束。基因的转录开始位置由转录起始位点确定,转录过程直至遇到转录终止位点结束,转录的内位点确定,转录过程直至遇到转录终止位点结束,转录的内位点确定,转录过程直至遇到转录终止位点结束,转录的内位点确定,转录过程直至遇到转录终止位点结束,转录的内容包括容包括容包括容包括5555端非翻译区、开放阅读框及端非翻译区、开放阅读框及端非翻译区、开放阅读框及端非翻译区、开放阅读框及3333端非翻译区

3、。基因翻端非翻译区。基因翻端非翻译区。基因翻端非翻译区。基因翻译的准确起止位置由起始密码子和终止密码子决定,翻译的译的准确起止位置由起始密码子和终止密码子决定,翻译的译的准确起止位置由起始密码子和终止密码子决定,翻译的译的准确起止位置由起始密码子和终止密码子决定,翻译的对象即为介于这两者之间的开放阅读框对象即为介于这两者之间的开放阅读框对象即为介于这两者之间的开放阅读框对象即为介于这两者之间的开放阅读框ORFORFORFORF。真核生物基因结构:一个完整的真核生物基因,不但包括编码区域,还包括一个完整的真核生物基因,不但包括编码区域,还包括一个完整的真核生物基因,不但包括编码区域,还包括一个完

4、整的真核生物基因,不但包括编码区域,还包括5555端和端和端和端和3333端两侧长度不等的特异性序列,虽然这些序列不编端两侧长度不等的特异性序列,虽然这些序列不编端两侧长度不等的特异性序列,虽然这些序列不编端两侧长度不等的特异性序列,虽然这些序列不编码氨基酸,却在基因表达的过程中起着重要的作用。所以,码氨基酸,却在基因表达的过程中起着重要的作用。所以,码氨基酸,却在基因表达的过程中起着重要的作用。所以,码氨基酸,却在基因表达的过程中起着重要的作用。所以,严格的严格的严格的严格的“基因基因基因基因”这一术语的分子生物学定义是:产生一条多这一术语的分子生物学定义是:产生一条多这一术语的分子生物学定

5、义是:产生一条多这一术语的分子生物学定义是:产生一条多肽链或功能肽链或功能肽链或功能肽链或功能RNARNARNARNA所必须的全部核苷酸序列。所必须的全部核苷酸序列。所必须的全部核苷酸序列。所必须的全部核苷酸序列。二、蛋白质结构 蛋白质是一种生物大分子,蛋白质中相邻的氨基蛋白质是一种生物大分子,蛋白质中相邻的氨基蛋白质是一种生物大分子,蛋白质中相邻的氨基蛋白质是一种生物大分子,蛋白质中相邻的氨基酸通过肽键形成一条伸展的肽链,这条链称为蛋白质酸通过肽键形成一条伸展的肽链,这条链称为蛋白质酸通过肽键形成一条伸展的肽链,这条链称为蛋白质酸通过肽键形成一条伸展的肽链,这条链称为蛋白质的一级结构,不同蛋

6、白质其肽链的长度不同,肽链中的一级结构,不同蛋白质其肽链的长度不同,肽链中的一级结构,不同蛋白质其肽链的长度不同,肽链中的一级结构,不同蛋白质其肽链的长度不同,肽链中不同氨基酸的组成和排列顺序也各不相同。肽链上的不同氨基酸的组成和排列顺序也各不相同。肽链上的不同氨基酸的组成和排列顺序也各不相同。肽链上的不同氨基酸的组成和排列顺序也各不相同。肽链上的氨基酸残基形成局部的二级结构,各种二级结构在空氨基酸残基形成局部的二级结构,各种二级结构在空氨基酸残基形成局部的二级结构,各种二级结构在空氨基酸残基形成局部的二级结构,各种二级结构在空间卷曲折叠形成特定的三维空间结构。有的蛋白质由间卷曲折叠形成特定的

7、三维空间结构。有的蛋白质由间卷曲折叠形成特定的三维空间结构。有的蛋白质由间卷曲折叠形成特定的三维空间结构。有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特多条肽链组成,每条肽链称为亚基,亚基之间又有特多条肽链组成,每条肽链称为亚基,亚基之间又有特多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构。定的空间关系,称为蛋白质的四级结构。定的空间关系,称为蛋白质的四级结构。定的空间关系,称为蛋白质的四级结构。DNA序列特征分析 分析分析分析分析DNADNA序列,除了进行序列比对之外,更重要的工作序列,除了进行序列比对之外,更重要的工作序列,除了进行序列比对之外

8、,更重要的工作序列,除了进行序列比对之外,更重要的工作是从序列中找到基因及其表达调控信息。寻找基因的工作有是从序列中找到基因及其表达调控信息。寻找基因的工作有是从序列中找到基因及其表达调控信息。寻找基因的工作有是从序列中找到基因及其表达调控信息。寻找基因的工作有两个:一是识别与基因相关的特殊序列信号,如启动子、起两个:一是识别与基因相关的特殊序列信号,如启动子、起两个:一是识别与基因相关的特殊序列信号,如启动子、起两个:一是识别与基因相关的特殊序列信号,如启动子、起始密码子,通过信号识别大致确定基因所在的区域;二是预始密码子,通过信号识别大致确定基因所在的区域;二是预始密码子,通过信号识别大致

9、确定基因所在的区域;二是预始密码子,通过信号识别大致确定基因所在的区域;二是预测基因的编码区域,或预测外显子所在的区域。在此基础上,测基因的编码区域,或预测外显子所在的区域。在此基础上,测基因的编码区域,或预测外显子所在的区域。在此基础上,测基因的编码区域,或预测外显子所在的区域。在此基础上,结合两个方面的结果确定基因的位置和结构。绝大部分基因结合两个方面的结果确定基因的位置和结构。绝大部分基因结合两个方面的结果确定基因的位置和结构。绝大部分基因结合两个方面的结果确定基因的位置和结构。绝大部分基因表达调控信息隐藏在基因序列的上游区域,在组成上具有一表达调控信息隐藏在基因序列的上游区域,在组成上

10、具有一表达调控信息隐藏在基因序列的上游区域,在组成上具有一表达调控信息隐藏在基因序列的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。定的特征,可以通过序列分析识别这些特征。定的特征,可以通过序列分析识别这些特征。定的特征,可以通过序列分析识别这些特征。真核生物的开放阅读框 真核生物的开放阅读框不仅含有编码蛋白的外显子真核生物的开放阅读框不仅含有编码蛋白的外显子真核生物的开放阅读框不仅含有编码蛋白的外显子真核生物的开放阅读框不仅含有编码蛋白的外显子(exonexonexonexon),而且还有内含子(),而且还有内含子(),而且还有内含子(),而且还有内含子(intronint

11、ronintronintron),并且内含子将开放阅),并且内含子将开放阅),并且内含子将开放阅),并且内含子将开放阅读框分割为若干个小片段。开放阅读框的长度变化范围非常大,读框分割为若干个小片段。开放阅读框的长度变化范围非常大,读框分割为若干个小片段。开放阅读框的长度变化范围非常大,读框分割为若干个小片段。开放阅读框的长度变化范围非常大,因此真核生物的基因预测远比原核生物困难。但是,在真核生因此真核生物的基因预测远比原核生物困难。但是,在真核生因此真核生物的基因预测远比原核生物困难。但是,在真核生因此真核生物的基因预测远比原核生物困难。但是,在真核生物的开放阅读框中,外显子与内含子之间的连接

12、绝大部分情况物的开放阅读框中,外显子与内含子之间的连接绝大部分情况物的开放阅读框中,外显子与内含子之间的连接绝大部分情况物的开放阅读框中,外显子与内含子之间的连接绝大部分情况下满足下满足下满足下满足GT-AGGT-AGGT-AGGT-AG规律:内含子序列规律:内含子序列规律:内含子序列规律:内含子序列 5 5 5 5 端的起始两个核苷酸总是端的起始两个核苷酸总是端的起始两个核苷酸总是端的起始两个核苷酸总是GTGTGTGT,并且其,并且其,并且其,并且其3333端的最后两个核苷酸总是端的最后两个核苷酸总是端的最后两个核苷酸总是端的最后两个核苷酸总是AGAGAGAG,即:,即:,即:,即:5-GT

13、 5-GT 5-GT 5-GT AG-3AG-3AG-3AG-3,这个规律有助于真核生物开放阅读框的识别。,这个规律有助于真核生物开放阅读框的识别。,这个规律有助于真核生物开放阅读框的识别。,这个规律有助于真核生物开放阅读框的识别。CpG岛 CpG islands CpG岛岛是指是指DNA序列上的一个区域,此区域含有大序列上的一个区域,此区域含有大量相联的胞嘧啶(量相联的胞嘧啶(C)、鸟嘌呤()、鸟嘌呤(G),以及使两者相连的),以及使两者相连的磷酸酯键(磷酸酯键(p)。)。CpG岛的概念是岛的概念是Gardiner-garden和和Fromner于于1987年提出的,基因中平均每年提出的,基

14、因中平均每100 Kb即可出现。即可出现。CpG岛位于基因的启动子和第一个外显子区,约有岛位于基因的启动子和第一个外显子区,约有60%80%的人类基因的启动子和起始外显子含有的人类基因的启动子和起始外显子含有CpG岛,岛,其中其中GC含量大于含量大于50%,长度超过,长度超过200bp。因此搜索。因此搜索CpG岛岛可以为基因及其启动子预测提供重要线索。可以为基因及其启动子预测提供重要线索。利用CpGPlot预测分析CpG岛 CpGPlot是预测是预测CpG岛的在线工具,它是由欧洲岛的在线工具,它是由欧洲分子生物学实验室分子生物学实验室EMBL European Molecular Biolog

15、y Laboratory提供的。提供的。其网址为:其网址为:http:/www.ebi.ac.uk/Tools/emboss/cpgplot/index.htmlCpGPlot在线操作页面用用CpGplotCpGplot预测预测AC002390AC002390序列的序列的CpGCpG岛的结果岛的结果 用用CpGReportCpGReport预测预测AC002390AC002390序列的序列的CpGCpG岛的结果岛的结果 五、密码子偏好性 密码子使用偏性是指生物体中编码同一种氨密码子使用偏性是指生物体中编码同一种氨密码子使用偏性是指生物体中编码同一种氨密码子使用偏性是指生物体中编码同一种氨基酸的

16、同义密码子的非均匀使用现象。这一现象基酸的同义密码子的非均匀使用现象。这一现象基酸的同义密码子的非均匀使用现象。这一现象基酸的同义密码子的非均匀使用现象。这一现象的产生与诸多因素有关,如基因的表达水平、翻的产生与诸多因素有关,如基因的表达水平、翻的产生与诸多因素有关,如基因的表达水平、翻的产生与诸多因素有关,如基因的表达水平、翻译起始效应、基因的碱基组分、某些二核苷酸的译起始效应、基因的碱基组分、某些二核苷酸的译起始效应、基因的碱基组分、某些二核苷酸的译起始效应、基因的碱基组分、某些二核苷酸的出现频率、出现频率、出现频率、出现频率、G+CG+C含量、基因的长度、含量、基因的长度、含量、基因的长

17、度、含量、基因的长度、tRNAtRNA的丰度、的丰度、的丰度、的丰度、蛋白质的结构及密码子一反密码子间结合能的大蛋白质的结构及密码子一反密码子间结合能的大蛋白质的结构及密码子一反密码子间结合能的大蛋白质的结构及密码子一反密码子间结合能的大小等。所以对密码子使用偏好性的分析具有重要小等。所以对密码子使用偏好性的分析具有重要小等。所以对密码子使用偏好性的分析具有重要小等。所以对密码子使用偏好性的分析具有重要的生物学意义。的生物学意义。的生物学意义。的生物学意义。利用CodonW分析密码子偏好性 CodonWCodonW是美国是美国是美国是美国DECDEC公司开发的对密码子的使用进行分公司开发的对密

18、码子的使用进行分公司开发的对密码子的使用进行分公司开发的对密码子的使用进行分析的免费的软件工具。此软件是建立在大量的统计学分析的析的免费的软件工具。此软件是建立在大量的统计学分析的析的免费的软件工具。此软件是建立在大量的统计学分析的析的免费的软件工具。此软件是建立在大量的统计学分析的基础上,为了简化在线分析的复杂性而开发的,它可以在基础上,为了简化在线分析的复杂性而开发的,它可以在基础上,为了简化在线分析的复杂性而开发的,它可以在基础上,为了简化在线分析的复杂性而开发的,它可以在WindowsWindows环境下运行,并且可以同时处理环境下运行,并且可以同时处理环境下运行,并且可以同时处理环境

19、下运行,并且可以同时处理20002000条以上的序列。条以上的序列。条以上的序列。条以上的序列。通过对通过对通过对通过对DNADNA或或或或RNARNA序列的分析,序列的分析,序列的分析,序列的分析,CodonWCodonW会产生关于密码子会产生关于密码子会产生关于密码子会产生关于密码子使用的相关指标的统计学分析的数据,我们可以利用这些数使用的相关指标的统计学分析的数据,我们可以利用这些数使用的相关指标的统计学分析的数据,我们可以利用这些数使用的相关指标的统计学分析的数据,我们可以利用这些数据对我们所要了解的序列进行分析。据对我们所要了解的序列进行分析。据对我们所要了解的序列进行分析。据对我们

20、所要了解的序列进行分析。其下载网址为:其下载网址为:其下载网址为:其下载网址为:ftp:/ftp:/molbiol.ox.ac.uk/cu/codonW.tar.Zmolbiol.ox.ac.uk/cu/codonW.tar.Z。CodonW1.4主菜单的操作页面 11个密码子使用的指标 序序序序 号号号号全全全全 称称称称缩缩缩缩 写写写写1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6 6 67 7 7 78 8 8 89 9 9 91010101011111111CodonCodon Adaptation Index Adaptation IndexFrequ

21、ency of Optimal Frequency of Optimal CodonsCodonsCodonCodon Bias Index Bias IndexThe effective number of The effective number of codonscodonsG+C content of the geneG+C content of the geneG+C content at 3rd position of synonymous G+C content at 3rd position of synonymous codonscodonsSilent base compo

22、sitionSilent base compositionNumber of silent sitesNumber of silent sitesand amino acidsand amino acidsHydrophobicityHydrophobicity of protein of proteinAromaticityAromaticity score scoreCAICAIFopFopCBICBIENcENcG+CG+CGC3sGC3sLSilLSilLAALAAGRAVYGRAVYAromoAromowaxy基因的序列 序序号号Genebank登陆号登陆号物物 种种基因功能基因功能

23、1234567AY094405AF486514X03935X62134X88789U23945X57233Arabidopsis halianaHordeum vulgareZea maysO.sativaP.sativumSorghum bicolorWheatgranule bound starch synthase I mRNAgranule bound starch synthase I mRNAglucosyl transferasegranule bound starch synthase I mRNAmRNA for starch synthasegranule-bound st

24、arch synthase precursor(Wx)mRNAwaxy mRNA for granule-bound starch synthase用CodonW分析waxy基因所得的RSCU值 和 个数 蛋白质序列特征分析 蛋白质是组成生物体的基本物质,是生命活动的主要承蛋白质是组成生物体的基本物质,是生命活动的主要承蛋白质是组成生物体的基本物质,是生命活动的主要承蛋白质是组成生物体的基本物质,是生命活动的主要承担者,一切生命活动都与蛋白质有关。虽然遗传信息的携带担者,一切生命活动都与蛋白质有关。虽然遗传信息的携带担者,一切生命活动都与蛋白质有关。虽然遗传信息的携带担者,一切生命活动都与蛋白

25、质有关。虽然遗传信息的携带者是核酸,但遗传信息的传递和表达不仅要在酶的催化之下,者是核酸,但遗传信息的传递和表达不仅要在酶的催化之下,者是核酸,但遗传信息的传递和表达不仅要在酶的催化之下,者是核酸,但遗传信息的传递和表达不仅要在酶的催化之下,并且也是在各种蛋白质的调节控制下进行的。因此,分析处并且也是在各种蛋白质的调节控制下进行的。因此,分析处并且也是在各种蛋白质的调节控制下进行的。因此,分析处并且也是在各种蛋白质的调节控制下进行的。因此,分析处理蛋白质序列数据的重要性并不亚于分析理蛋白质序列数据的重要性并不亚于分析理蛋白质序列数据的重要性并不亚于分析理蛋白质序列数据的重要性并不亚于分析DNA

26、DNADNADNA序列数据。蛋白序列数据。蛋白序列数据。蛋白序列数据。蛋白质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的功能时需要了解蛋白质的空间结构。功能时需要了解蛋白质的空间结构。功能时需要了解蛋白质的空间结构。功能时需要了解蛋白质的空间结构。二、蛋白质的亲水性或疏水性氨基酸通常被分为三类:氨基酸通常被分为三类:氨基酸通常被分为三类:氨基酸通常被分为三类:1.1.疏水氨基酸疏水氨基酸疏水氨基酸疏水氨基酸(hydrophobic a

27、mino acidhydrophobic amino acid),其侧链大部分),其侧链大部分),其侧链大部分),其侧链大部分 或者全部由碳原子和氢原子组成,因此这类氨基酸不太可或者全部由碳原子和氢原子组成,因此这类氨基酸不太可或者全部由碳原子和氢原子组成,因此这类氨基酸不太可或者全部由碳原子和氢原子组成,因此这类氨基酸不太可 能与水分子形成氢键;能与水分子形成氢键;能与水分子形成氢键;能与水分子形成氢键;2.2.极性氨基酸极性氨基酸极性氨基酸极性氨基酸(polar amino acidpolar amino acid),其测链通常由氧原子或),其测链通常由氧原子或),其测链通常由氧原子或),

28、其测链通常由氧原子或 氮原子组成,它们比较容易与水分子形成氢键,因此也称氮原子组成,它们比较容易与水分子形成氢键,因此也称氮原子组成,它们比较容易与水分子形成氢键,因此也称氮原子组成,它们比较容易与水分子形成氢键,因此也称 为亲水氨基酸;为亲水氨基酸;为亲水氨基酸;为亲水氨基酸;3.3.带电氨基酸带电氨基酸带电氨基酸带电氨基酸(charged amino acidscharged amino acids),这类氨基酸在生物),这类氨基酸在生物),这类氨基酸在生物),这类氨基酸在生物 pHpH环境中带有正电或负电。环境中带有正电或负电。环境中带有正电或负电。环境中带有正电或负电。蛋白质的基本组成

29、单元是氨基酸。蛋白质的基本组成单元是氨基酸。蛋白质的基本组成单元是氨基酸。蛋白质的基本组成单元是氨基酸。蛋白质的亲水性或疏水性 氨基酸的亲疏水性是构成蛋白质折叠的主要驱氨基酸的亲疏水性是构成蛋白质折叠的主要驱氨基酸的亲疏水性是构成蛋白质折叠的主要驱氨基酸的亲疏水性是构成蛋白质折叠的主要驱动力,一般通过亲水性分布图(动力,一般通过亲水性分布图(动力,一般通过亲水性分布图(动力,一般通过亲水性分布图(hydropathyhydropathy profile profile)反映蛋白质的折叠情况。蛋白质折叠时会形成疏水反映蛋白质的折叠情况。蛋白质折叠时会形成疏水反映蛋白质的折叠情况。蛋白质折叠时会形

30、成疏水反映蛋白质的折叠情况。蛋白质折叠时会形成疏水内核和亲水表面,同时在潜在跨膜区出现高疏水值内核和亲水表面,同时在潜在跨膜区出现高疏水值内核和亲水表面,同时在潜在跨膜区出现高疏水值内核和亲水表面,同时在潜在跨膜区出现高疏水值区域,据此可以测定跨膜螺旋等二级结构和蛋白质区域,据此可以测定跨膜螺旋等二级结构和蛋白质区域,据此可以测定跨膜螺旋等二级结构和蛋白质区域,据此可以测定跨膜螺旋等二级结构和蛋白质表面氨基酸分布。表面氨基酸分布。表面氨基酸分布。表面氨基酸分布。利用ProtScale分析蛋白质的亲水性或疏水性 ExPASyExPASy的的的的ProtScaleProtScale程序是计算蛋白质

31、亲疏程序是计算蛋白质亲疏程序是计算蛋白质亲疏程序是计算蛋白质亲疏水性分析的在线工具。水性分析的在线工具。水性分析的在线工具。水性分析的在线工具。其网址为:其网址为:其网址为:其网址为:http:/http:/expasy.org/tools/protscale.htmlexpasy.org/tools/protscale.html ProtScale在线页面用用ProtScaleProtScale分析分析P02699P02699序列疏水性结果的图形显示序列疏水性结果的图形显示 利用TMpred分析蛋白质的跨膜区 TMpredTMpred是是是是EMBnetEMBnet开发的一个分析蛋白质跨膜区

32、的在线开发的一个分析蛋白质跨膜区的在线开发的一个分析蛋白质跨膜区的在线开发的一个分析蛋白质跨膜区的在线工具,工具,工具,工具,TMpredTMpred基于对基于对基于对基于对TMbaseTMbase数据库的统计分析来预测蛋白质数据库的统计分析来预测蛋白质数据库的统计分析来预测蛋白质数据库的统计分析来预测蛋白质跨膜区和跨膜方向。跨膜区和跨膜方向。跨膜区和跨膜方向。跨膜区和跨膜方向。TMbaseTMbase来源于来源于来源于来源于Swiss-ProtSwiss-Prot库,并包含了每库,并包含了每库,并包含了每库,并包含了每个序列的一些附加信息,如:跨膜结构区域的数量、跨个序列的一些附加信息,如:

33、跨膜结构区域的数量、跨个序列的一些附加信息,如:跨膜结构区域的数量、跨个序列的一些附加信息,如:跨膜结构区域的数量、跨膜结构域的位置及其侧翼序列的情况。膜结构域的位置及其侧翼序列的情况。膜结构域的位置及其侧翼序列的情况。膜结构域的位置及其侧翼序列的情况。TMpredTMpred利用这些信息利用这些信息利用这些信息利用这些信息并与若干加权矩阵结合来进行预测。并与若干加权矩阵结合来进行预测。并与若干加权矩阵结合来进行预测。并与若干加权矩阵结合来进行预测。其网址为:其网址为:其网址为:其网址为:http:/http:/www.ch.embnet.org/software/TMPRED_form.ht

34、mlwww.ch.embnet.org/software/TMPRED_form.html TMpred在线网页用TMpred分析P51684序列所得到的可能的7个跨膜螺旋区 用TMpred分析P51684序列所得到的7个可能的跨膜螺旋区的相关性列表 用TMpred分析P51684序列所得到的7个可能的跨膜螺旋区的建议的跨膜拓扑模型 用TMpred分析P51684序列所得到的7个可能的跨膜螺旋区的图形显示结果 蛋白质的卷曲螺旋coiled-coil 卷曲螺旋是蛋白质空间结构中的一种,它是由卷曲螺旋是蛋白质空间结构中的一种,它是由卷曲螺旋是蛋白质空间结构中的一种,它是由卷曲螺旋是蛋白质空间结构中

35、的一种,它是由2 2 7 7个个个个 螺旋相互缠绕而形成超螺旋结构的总称。卷曲螺旋区域一螺旋相互缠绕而形成超螺旋结构的总称。卷曲螺旋区域一螺旋相互缠绕而形成超螺旋结构的总称。卷曲螺旋区域一螺旋相互缠绕而形成超螺旋结构的总称。卷曲螺旋区域一般由般由般由般由7 7个氨基酸残基为单位组成,以个氨基酸残基为单位组成,以个氨基酸残基为单位组成,以个氨基酸残基为单位组成,以a a、b b、c c、d d、e e、f f、g g位置表示,其中位置表示,其中位置表示,其中位置表示,其中a a和和和和d d位置为疏水性氨基酸,而其他位置的位置为疏水性氨基酸,而其他位置的位置为疏水性氨基酸,而其他位置的位置为疏水

36、性氨基酸,而其他位置的氨基酸残基为亲水性。许多含有卷曲螺旋结构的蛋白质具氨基酸残基为亲水性。许多含有卷曲螺旋结构的蛋白质具氨基酸残基为亲水性。许多含有卷曲螺旋结构的蛋白质具氨基酸残基为亲水性。许多含有卷曲螺旋结构的蛋白质具有重要的生物学功能,例如基因表达调控中的转录因子。有重要的生物学功能,例如基因表达调控中的转录因子。有重要的生物学功能,例如基因表达调控中的转录因子。有重要的生物学功能,例如基因表达调控中的转录因子。含有卷曲螺旋结构最知名的蛋白质有原癌蛋白含有卷曲螺旋结构最知名的蛋白质有原癌蛋白含有卷曲螺旋结构最知名的蛋白质有原癌蛋白含有卷曲螺旋结构最知名的蛋白质有原癌蛋白(oncoprot

37、einoncoprotein)c-fosc-fos和和和和junjun,以及原肌球蛋白(,以及原肌球蛋白(,以及原肌球蛋白(,以及原肌球蛋白(tropomyosintropomyosin)。)。)。)。利用COILS分析蛋白质的卷曲螺旋 COILS COILS是由是由是由是由Swiss Swiss EMBNetEMBNet维护的预测卷曲螺旋的在维护的预测卷曲螺旋的在维护的预测卷曲螺旋的在维护的预测卷曲螺旋的在线工具,该软件是基于线工具,该软件是基于线工具,该软件是基于线工具,该软件是基于LupasLupas算法,将查询序列在一个由算法,将查询序列在一个由算法,将查询序列在一个由算法,将查询序列

38、在一个由已知包含卷曲螺旋蛋白结构的数据库中进行搜索,同时也已知包含卷曲螺旋蛋白结构的数据库中进行搜索,同时也已知包含卷曲螺旋蛋白结构的数据库中进行搜索,同时也已知包含卷曲螺旋蛋白结构的数据库中进行搜索,同时也将查询序列与包含球状蛋白序列的将查询序列与包含球状蛋白序列的将查询序列与包含球状蛋白序列的将查询序列与包含球状蛋白序列的PDBPDB次级库进行比较,次级库进行比较,次级库进行比较,次级库进行比较,并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。COILSCOILS也可以下载到本地进行运算。也可以下载到本地进行运算。也可以下载到本地进行运算。也可以下载到本地进行运算。其网址为:其网址为:其网址为:其网址为:http:/http:/www.ch.embnet.org/software/COILS_form.htmlwww.ch.embnet.org/software/COILS_form.htmlCOILS在线网页用COILS分析GO45_HUMAN卷曲螺旋的图形显示结果 用COILS分析GO45_HUMAN卷曲螺旋的文本显示结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 施工组织

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁