《序列相似性的概念讲稿.ppt》由会员分享,可在线阅读,更多相关《序列相似性的概念讲稿.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、序列相似性的概念1第一页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)序列比较:序列比较包括从两个或多个序列中找出所有显著相似的区域。序列比较:序列比较包括从两个或多个序列中找出所有显著相似的区域。最主要的问题是必须首先作出定义,对于生物序列来说何为显著相似。最主要的问题是必须首先作出定义,对于生物序列来说何为显著相似。在开始讲程序之前,让我们先了解一下它们做些什么和为什么那在开始讲程序之前,让我们先了解一下它们做些什么和为什么那样做。这一节主要是关于序列比较是如何进行的。样做。这一节主要是关于
2、序列比较是如何进行的。2第二页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)当我们比较两个序列时,总是会对显著相似的区段比较感兴趣,当我们比较两个序列时,总是会对显著相似的区段比较感兴趣,可是从生物学的角度如何定义何为可是从生物学的角度如何定义何为“显著相似显著相似”?为了更好的理?为了更好的理解这一点,让我们先看看几个例子。首先从比较两个简单序列开解这一点,让我们先看看几个例子。首先从比较两个简单序列开始。始。ATGCATGCATGCATGCATATATATATATATATATGCATGCAT
3、GCATGCATGC|CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT 3第三页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)在这里我们只是简单的将两个序列并排比较,对比两个序列之间在这里我们只是简单的将两个序列并排比较,对比两个序列之间的碱基,将匹配的残基用垂直线标出,可见一个保守的区域。但的碱基,将匹配的残基用垂直线标出,可见一个保守的区域。但是,是否还有更好的排比方式呢?显然,如果将其中一个序列相是,是否还有更好的排比方式呢?显然,如
4、果将其中一个序列相对另一序列错开两个碱基位置,可以得到一个更好的排比结果对另一序列错开两个碱基位置,可以得到一个更好的排比结果(这里说更好是指得到更多相匹配的碱基这里说更好是指得到更多相匹配的碱基)ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC|CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT4第四页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)结论是,我们不能够简单的将两个序列头尾
5、对应的排比,而是对各种结论是,我们不能够简单的将两个序列头尾对应的排比,而是对各种可能的排比方式都进行比较以找出最佳的排比结果。可是,这还不行。可能的排比方式都进行比较以找出最佳的排比结果。可是,这还不行。生物体有许多变化的机制,简单的从一个残基变为另一个残基只是其生物体有许多变化的机制,简单的从一个残基变为另一个残基只是其中之一,而插入和缺失也经常发生,我们是否可以将插入和缺失考虑中之一,而插入和缺失也经常发生,我们是否可以将插入和缺失考虑进去,以得到更好的排比结果呢?进去,以得到更好的排比结果呢?ATGCATGCATGCATGCATATATATATAT-ATATATGCATGCATGCAT
6、GCATGC|CGATCGATCGATCGATATATATATATGCATATAT-ATGCATGCATGCATGCAT5第五页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)这里我们用了连字号这里我们用了连字号(-)(-)来标记插入来标记插入/缺失的事件。仅仅观察两个序列是缺失的事件。仅仅观察两个序列是很难知道是否有插入或缺失的发生的,因此我们将它简称为一个很难知道是否有插入或缺失的发生的,因此我们将它简称为一个“indel”indel”。插入插入“indels”indels”通常会大大增加匹配
7、残基的数目:通常会大大增加匹配残基的数目:在序列比较时必在序列比较时必在序列比较时必在序列比较时必须考虑须考虑须考虑须考虑“gaps”gaps”的存在,采用的存在,采用的存在,采用的存在,采用“gaps”gaps”通常可以大大增加匹配残基通常可以大大增加匹配残基通常可以大大增加匹配残基通常可以大大增加匹配残基的数量的数量的数量的数量。-AT-GCAT-GCATGC-ATGCATATATATATAT-ATATAT-GCATGCATGCATGCATGC|CGATCG-ATCG-AT-CG-ATATATATATATGCATATATATGCATGCATGCATGCAT6第六页,讲稿共四十页哦Dotpl
8、ots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)但是,在加入但是,在加入“gaps”gaps”后又会出现一个问题:这个排比是否还有意后又会出现一个问题:这个排比是否还有意义呢?如上述例子,我们通过加入了许多义呢?如上述例子,我们通过加入了许多“gaps”gaps”来增加相似度,来增加相似度,仅仅为了得到多一些匹配残基数就加入许多的仅仅为了得到多一些匹配残基数就加入许多的“gaps”gaps”,这样做是否值,这样做是否值得呢?答案是:得呢?答案是:有时有时。(不很满意,是吗?不很满意,是吗?)有时确实值得,而有时有时确实值得
9、,而有时又不划算。如果我们需要使序列变化太大,那很可能是不值得的。又不划算。如果我们需要使序列变化太大,那很可能是不值得的。怎样知道是否值得呢?怎样知道是否值得呢?通过大量的观察研究表明,通过大量的观察研究表明,“indel”indel”事件发生的机率远小于点突变。事件发生的机率远小于点突变。而常识又告诉我们,在上述例子中,单碱基的而常识又告诉我们,在上述例子中,单碱基的“indels”indels”有可能破有可能破坏序列上原来的开放读码框,如果有的话。因此坏序列上原来的开放读码框,如果有的话。因此,“gaps”gaps”比单点突变比单点突变代表了更大的生物学改变代表了更大的生物学改变。“in
10、dels(gaps)”indels(gaps)”在引入时必须格外小心。在引入时必须格外小心。7第七页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)如上述,将两个序列相对位移如上述,将两个序列相对位移(shift)(shift),根据突变的情况引入,根据突变的情况引入“gaps”gaps”可可以得到更好的排比结果。但是,这样做是否就已经发掘了所有的显以得到更好的排比结果。但是,这样做是否就已经发掘了所有的显著匹配?仔细再看看可以发现,我们还忽略了一些重要的特征,让著匹配?仔细再看看可以发现,我们还
11、忽略了一些重要的特征,让我们用不同颜色标出:我们用不同颜色标出:ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGCCGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT8第八页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)是的,有一个重复序列模体是的,有一个重复序列模体(motif)(motif)分布于序列中,从简单的排比中是分布于序列中,从简单的排比中是不可能使这种特异序列显现出来的。因那样
12、只能使其中一序列上的模不可能使这种特异序列显现出来的。因那样只能使其中一序列上的模体与另一序列上的模体匹配,而不能使所有的模体在排比中互相匹配,体与另一序列上的模体匹配,而不能使所有的模体在排比中互相匹配,我们需要更好的方式来比较序列的相似度,而不仅仅是简单的排比我们需要更好的方式来比较序列的相似度,而不仅仅是简单的排比。ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGCCGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT9第九页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列
13、比较的问题(The problem with sequence comparison)可是,问题还不仅于此。让我们仔细看看以下两个序列,看是否能找出显可是,问题还不仅于此。让我们仔细看看以下两个序列,看是否能找出显著相似的区段。著相似的区段。它们似乎并无多少相似,是吗?当然,可以通过一些位移和它们似乎并无多少相似,是吗?当然,可以通过一些位移和gapsgaps增加相似度,好象也不存在明显的重复序列。然而,这两个序列却给人相增加相似度,好象也不存在明显的重复序列。然而,这两个序列却给人相似的印象,只是第一眼看去不明显而已。只要把其中一个序列水平打转,似的印象,只是第一眼看去不明显而已。只要把其中
14、一个序列水平打转,让其让其55端与端与33端对调。端对调。ATGCGACATTATATGGACGCCGACAATATGCATGACTAGCATAGCATGCGAT|TAGCGTACGAGACGTTCAGTAGGTATAACAGTCGCAGGTATCTTACAGCGTA10第十页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)很吃惊,是吧。让我们再看看下面的例子,找到相似的地方吗?很吃惊,是吧。让我们再看看下面的例子,找到相似的地方吗?ATGCGACATTATATGGACGCCGACAATATGCA
15、TGACTAGCATAGCATGCGAT|ATGCGACATTCTATGGACGCTGACAATATGGATGACTTGCAGAGCATGCGATATGCGATCAGATGATCAGATGACATGACATAGGCATACCCAATTGACATACG|CGTATGTCAATTGGGTATGCCTAT GTCATGTCAT CTGATCATCTGATCGCAT11第十一页,讲稿共四十页哦Dotplots-序列相似性的作图分析 序列比较的问题(The problem with sequence comparison)是的,这一次序列已经被反转为互补的了。你看,除了简单的将两个是的,这一次序列已经被
16、反转为互补的了。你看,除了简单的将两个序列放到一起比较以外,还是有很多可以做的,而且有时仅靠肉眼判序列放到一起比较以外,还是有很多可以做的,而且有时仅靠肉眼判断还是非常难的。这就是为什么我们非得用计算机工具来帮助做这些断还是非常难的。这就是为什么我们非得用计算机工具来帮助做这些工作的原因。工作的原因。ATGCGATCAGATGATCAGATGACATGACATAGGCATACCCAATTGACATACG|CGTATGTCAATTGGGTATGCCTAT GTCATGTCAT CTGATCATCTGATCGCAT12第十二页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序
17、列我们可以让计算机以最佳的方式来作序列比较。开始时,可以先将两我们可以让计算机以最佳的方式来作序列比较。开始时,可以先将两个序列摆在一起,数一数匹配的残基数。可是,这样还没有考虑生物个序列摆在一起,数一数匹配的残基数。可是,这样还没有考虑生物序列的另一相关因子:序列的另一相关因子:残基之间可以存在不同的相似度残基之间可以存在不同的相似度。例如,亮氨。例如,亮氨酸与异亮氨酸的相似度大于其与其它氨基酸如组氨酸等的相似度,尽管它酸与异亮氨酸的相似度大于其与其它氨基酸如组氨酸等的相似度,尽管它们都属于不同的氨基酸。们都属于不同的氨基酸。13第十三页,讲稿共四十页哦Dotplots-序列相似性的作图分析
18、 利用计算机比较序列因此,第一步首先制作一个表或距阵,用来标明各不同氨基酸残基因此,第一步首先制作一个表或距阵,用来标明各不同氨基酸残基之间的相似度。这样一来,计算机就不会将亮氨酸变为异亮氨酸与之间的相似度。这样一来,计算机就不会将亮氨酸变为异亮氨酸与亮氨酸变为组氨酸等同对待。有好些这种氨基酸相似度表或距阵已亮氨酸变为组氨酸等同对待。有好些这种氨基酸相似度表或距阵已被制作出来,如被制作出来,如PAMPAM、BLOSUMBLOSUM、BLOSUM32BLOSUM32等,每个距阵都是根等,每个距阵都是根据不同的假设或实验数据制作出来。计算机就根据这些表来判定残据不同的假设或实验数据制作出来。计算机
19、就根据这些表来判定残基之间的相似度。基之间的相似度。14第十四页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列当然,我们还希望计算机将两个序列逐个碱基相对错位,以免忽略当然,我们还希望计算机将两个序列逐个碱基相对错位,以免忽略耷掉任何相似的区段。如果我们把这一过程做成一个二维的图表,耷掉任何相似的区段。如果我们把这一过程做成一个二维的图表,可能比较容易看出这个工作是如何完成的。在图表中,将其中一个可能比较容易看出这个工作是如何完成的。在图表中,将其中一个序列的残基与另一序列的所有残基逐一比较。序列的残基与另一序列的所有残基逐一比较。15第十五页,讲稿共四十页哦Dot
20、plots-序列相似性的作图分析 利用计算机比较序列 C|X G|X A T G C T|X|A|X A T G C +-A T G C16第十六页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列上图的对角线代表不作任何移位比较两个序列时的匹配残基。就象前面举上图的对角线代表不作任何移位比较两个序列时的匹配残基。就象前面举的第一个例子一样。而一系列的位移比较可以用相邻的对角线表示:的第一个例子一样。而一系列的位移比较可以用相邻的对角线表示:17第十七页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列 A|X .C|.X A T G C A G
21、|X .X|T|.X G A T G C A|.X +-G A T G C18第十八页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列这里,我们这里,我们将主对角线用点标出将主对角线用点标出以作参考。可以看出,相似的区域表以作参考。可以看出,相似的区域表现为对角线。而相对的错位则简单的表现为移置的对角线。现为对角线。而相对的错位则简单的表现为移置的对角线。孤立的匹配孤立的匹配标记代表个别的匹配而不是区段的匹配标记代表个别的匹配而不是区段的匹配,因此将其忽略不计。,因此将其忽略不计。19第十九页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列这
22、一方法在查看反转序列时也很有用,反转的序列将简单的表现为这一方法在查看反转序列时也很有用,反转的序列将简单的表现为反对角线。反对角线。A|X T|X C G T A G|X C|X A T G C +-A T G C20第二十页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列采用这一方法,不断位移时从不同的残基开始比较表现为不同的对角线。采用这一方法,不断位移时从不同的残基开始比较表现为不同的对角线。事实上我们将经常用事实上我们将经常用“对角线对角线”这个词作为相似性的同义词。你可以想象这个词作为相似性的同义词。你可以想象为对角线是两个序列在互相移位后向上转为对角线是
23、两个序列在互相移位后向上转4545度所成。度所成。21第二十一页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列对角线比拟法在查找前面见过的序列中隐藏特征时也很有用。例如,对角线比拟法在查找前面见过的序列中隐藏特征时也很有用。例如,一个重复序列会表现为一系列平行的对角线,它们从不同的残基发一个重复序列会表现为一系列平行的对角线,它们从不同的残基发出而有同样的长度。出而有同样的长度。22第二十二页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列23第二十三页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列查找反转的重复
24、序列、查找反转的重复序列、stem-loopsstem-loops等,也可以通过检查这个二维图很等,也可以通过检查这个二维图很容易找出:容易找出:24第二十四页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列一旦我们了每一个残基相对位移比较完了序列之后,加一旦我们了每一个残基相对位移比较完了序列之后,加gapsgaps的工作就等的工作就等于是在不断的移位残基比较中查找相似的区段,然后用适当的于是在不断的移位残基比较中查找相似的区段,然后用适当的gapsgaps将它们连接起来。说起来简单,实际上还是很难的。因为计算机可能会加将它们连接起来。说起来简单,实际上还是很难的。
25、因为计算机可能会加入太多的入太多的gapsgaps,而我们知道自然情况下,而我们知道自然情况下gapsgaps并非发生的很频繁,而且它们并非发生的很频繁,而且它们通常会破坏序列的功能。通常会破坏序列的功能。我们需要建立一个方法来评定哪里需要加我们需要建立一个方法来评定哪里需要加gapsgaps。但一旦加了但一旦加了gapsgaps之后,对于其它的限制,如引入新的邻近之后,对于其它的限制,如引入新的邻近gapgap,即延长即延长gapgap的长度,则应相对放松。的长度,则应相对放松。25第二十五页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列所以关键的问题是引入所以关
26、键的问题是引入gapsgaps,也就是产生一个,也就是产生一个“indel”indel”事件。但事件。但一旦产生了,它是可以有不同大小的。一旦产生了,它是可以有不同大小的。GapsGaps越大时对功能产生的影越大时对功能产生的影响也越大。响也越大。要解决这一问题,我们需要为计算机建立一套双值打分系统。一个要解决这一问题,我们需要为计算机建立一套双值打分系统。一个值判断产生新的值判断产生新的gapsgaps,另一个值判断,另一个值判断gapgap的延伸。计算机有了这两个的延伸。计算机有了这两个值,就可以通过不同的对角线查找不重叠值,就可以通过不同的对角线查找不重叠(non-overlapping
27、)(non-overlapping)的相似区段并的相似区段并通过引入通过引入gapsgaps试图将之连接起来。试图将之连接起来。26第二十六页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列27第二十七页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列可见,对角线的的思路引至了非常有效的序列比较分析方法。其实,可见,对角线的的思路引至了非常有效的序列比较分析方法。其实,这就是目前大多数计算机程序做序列比较分析时所采用的方法:它们这就是目前大多数计算机程序做序列比较分析时所采用的方法:它们首先尝试象上述一样的建立一个序列比较的距阵,然后寻找对角
28、线,首先尝试象上述一样的建立一个序列比较的距阵,然后寻找对角线,最后尝试将尽可能多的对角线连接起来,成为一个最佳相似排比最后尝试将尽可能多的对角线连接起来,成为一个最佳相似排比(记住:记住:一个对角线代表一个相似的序列区段一个对角线代表一个相似的序列区段)。28第二十八页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列可是,这一方法还有两个主要缺点:可是,这一方法还有两个主要缺点:比较的量,它随着序列大小的增加而增加,因为每一个残基都要比较的量,它随着序列大小的增加而增加,因为每一个残基都要与另一序列的所有残基比较;与另一序列的所有残基比较;必须从距阵中寻找对角线,并
29、寻找各种可能的组合,以找出最佳排比。必须从距阵中寻找对角线,并寻找各种可能的组合,以找出最佳排比。29第二十九页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列完成以上两步在计算机的运算中是非常消耗资源的,因此,大多完成以上两步在计算机的运算中是非常消耗资源的,因此,大多数计算机软件都走捷径来加快运算的速度,让我们看一个稍微复数计算机软件都走捷径来加快运算的速度,让我们看一个稍微复杂的比较:杂的比较:30第三十页,讲稿共四十页哦31第三十一页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列这里所比较的也只不过是两个小序列这里所比较的也只不过是
30、两个小序列(约约100100碱基碱基)。可以从中看出一些。可以从中看出一些对角线,但是它们被大量孤立的点弄模糊了。这些孤立点代表随机对角线,但是它们被大量孤立的点弄模糊了。这些孤立点代表随机的匹配。由于点太多,要判断哪些是有关的哪些是无关的,即使对的匹配。由于点太多,要判断哪些是有关的哪些是无关的,即使对计算机来说也是很艰难的工作。计算机来说也是很艰难的工作。32第三十二页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列这里所比较的也只不过是两个小序列这里所比较的也只不过是两个小序列(约约100100碱基碱基)。可以从中看出一些。可以从中看出一些对角线,但是它们被大量
31、孤立的点弄模糊了。这些孤立点代表随机的对角线,但是它们被大量孤立的点弄模糊了。这些孤立点代表随机的匹配。由于点太多,要判断哪些是有关的哪些是无关的,即使对计算匹配。由于点太多,要判断哪些是有关的哪些是无关的,即使对计算机来说也是很艰难的工作。机来说也是很艰难的工作。要加速这一序列比较进程的可能解决方法是用要加速这一序列比较进程的可能解决方法是用“词词”(word)(word)来减少来减少需要比较的数量。一个词是一套连续的残基,把它们当作一个单位,需要比较的数量。一个词是一套连续的残基,把它们当作一个单位,计算机将一次过比较计算机将一次过比较“词词”中的所有残基,因此,减少了要进行的中的所有残基
32、,因此,减少了要进行的总比较数量。总比较数量。33第三十三页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列任何情况下我们都是对一段连续的相似残基感兴趣,而对随机匹配任何情况下我们都是对一段连续的相似残基感兴趣,而对随机匹配不感兴趣,也就是对沿着对角线的匹配感兴趣。我们可以设一个最不感兴趣,也就是对沿着对角线的匹配感兴趣。我们可以设一个最小的对角线长度,比如说小的对角线长度,比如说1010个连续的残基,这样一来就可以消除随个连续的残基,这样一来就可以消除随机的点,这就叫一个机的点,这就叫一个“windowwindow”(”(窗口窗口)。要求至少有这么长的相。要求至少有
33、这么长的相似区段才去考虑它,但这样一来又会排除了一些低相似度或散布似区段才去考虑它,但这样一来又会排除了一些低相似度或散布的相似区段。我们可以通过允许在的相似区段。我们可以通过允许在“windowwindow”中有一些不匹配的残中有一些不匹配的残基,从而得到更加精确的结果。因此在相似的地带容纳一些小的不匹配区,基,从而得到更加精确的结果。因此在相似的地带容纳一些小的不匹配区,这就是我们通常所称的这就是我们通常所称的“严谨度严谨度”(stringency)”(stringency)。就象杂交实验的洗涤一。就象杂交实验的洗涤一样,严谨度越高,留在膜上的越是相似的序列。样,严谨度越高,留在膜上的越是
34、相似的序列。34第三十四页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列以下例子的以下例子的windowwindow大小为大小为2121,严谨度为,严谨度为1414。这就是说,被选出的相似区大。这就是说,被选出的相似区大小为小为2121残基,其相似的分值最小为残基,其相似的分值最小为1414。严谨度通常以最小分值给出,即比。严谨度通常以最小分值给出,即比较时较时windowwindow最少达到该相似度才被认为是与分析相关的。需要支出的是,最少达到该相似度才被认为是与分析相关的。需要支出的是,分值是根据相似表距阵的值计算出来的。然后将分值是根据相似表距阵的值计算出来的
35、。然后将windowwindow中各残基的分值中各残基的分值相加。于是,严谨度越高,被接受为显著相似的匹配相加。于是,严谨度越高,被接受为显著相似的匹配windowwindow的相似度越的相似度越高。高。35第三十五页,讲稿共四十页哦36第三十六页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列好多了,是吗?好多了,是吗?用用“词词”、windowwindow、和、和stringencystringency来处理序列的比较并非一件轻松来处理序列的比较并非一件轻松的工作,就象洗涤杂交一样的难,可以认为它本身就是一种艺术,的工作,就象洗涤杂交一样的难,可以认为它本身就是一
36、种艺术,但也不能因此而限制了我们使用计算机。但也不能因此而限制了我们使用计算机。37第三十七页,讲稿共四十页哦Dotplots-序列相似性的作图分析 利用计算机比较序列现在用计算机进行序列比较已经达到了很快的速度,我们只需选现在用计算机进行序列比较已经达到了很快的速度,我们只需选择不同的参数,然后查看所得结果,直到得出令人满意的结果。择不同的参数,然后查看所得结果,直到得出令人满意的结果。我们只需要记住一个很简单的规律,那就是:我们只需要记住一个很简单的规律,那就是:用用用用用计算机,用计算机,直到你已经找到了所有感兴趣的东西并对结果非常满意,并且因此直到你已经找到了所有感兴趣的东西并对结果非
37、常满意,并且因此而为自己感到自豪。而为自己感到自豪。随着我们对计算机程序越来越熟悉,会对计算机的工作更有好感并能更有随着我们对计算机程序越来越熟悉,会对计算机的工作更有好感并能更有效的使用它们。效的使用它们。38第三十八页,讲稿共四十页哦最佳全序列排比-Globally optimal sequence alignment:The Needleman-Wunsch-Sellers Globally optimal sequence alignment:The Needleman-Wunsch-Sellers Algorithm(Dynamic programming)Algorithm(Dyn
38、amic programming)Contents of this section:Dynamic Programming The Needleman-Wunsch-Sellers Algorithm An explicit example Gap penalties Literature and further reading 39第三十九页,讲稿共四十页哦最佳全序列排比-Globally optimal sequence alignment:The Needleman-Wunsch-Sellers Algorithm(Dynamic Globally optimal sequence alignment:The Needleman-Wunsch-Sellers Algorithm(Dynamic programming)programming)动态程序(Dynamic Programming)40第四十页,讲稿共四十页哦