分子进化和系统发育ppt课件.ppt

上传人:飞****2 文档编号:29425723 上传时间:2022-07-31 格式:PPT 页数:91 大小:5.56MB
返回 下载 相关 举报
分子进化和系统发育ppt课件.ppt_第1页
第1页 / 共91页
分子进化和系统发育ppt课件.ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述

《分子进化和系统发育ppt课件.ppt》由会员分享,可在线阅读,更多相关《分子进化和系统发育ppt课件.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、分子进化和系统发育分子进化和系统发育Darwin, Charles(1809-1882) The Origin of Species(1859)共同祖先共同祖先 化石证据化石证据最理想的方法最理想的方法经典的进化研究方法经典的进化研究方法然而然而零散、不完整零散、不完整 形态学证据形态学证据确定大致的进化框架确定大致的进化框架经典的进化研究方法经典的进化研究方法分子进化研究分子进化研究分子进化理论由莱纳斯分子进化理论由莱纳斯.鲍林(鲍林(Linus Pauling)于)于 1964年提出。年提出。该理论基本假设:核苷酸和氨基酸序列中含有生物该理论基本假设:核苷酸和氨基酸序列中含有生物进化历史的

2、全部信息。进化历史的全部信息。ACTCGACTTACTCGGCTTACTTGGCTTGCTTGGCTTGCTTGTCTTGATTGTCTCCATTGTCACCACTATCACCACTATGAC系统发育分析:系统发育分析:研究物种进化和系统分类的一种方研究物种进化和系统分类的一种方法,常用一种类似树状分支的图形来概括法,常用一种类似树状分支的图形来概括各物种各物种/类类群生物之间的亲缘关系,这种树状分支的图形称为群生物之间的亲缘关系,这种树状分支的图形称为系统发育树。系统发育树。系统发育系统发育(phylogeny)相关概念相关概念Tree of Life:重建所有生物的进化历史并以系统树的形式

3、加以描述。分子进化研究分子进化研究系统进化树系统进化树16S rDNA分子进化研究分子进化研究物种分类物种分类分子进化研究分子进化研究人类起源人类起源(Out of Africa)线粒体基因组(16,587bp)人类迁移的路线当前人类线粒体基因组最大的差异存在于非洲和非非洲人之间。分子钟理论分子钟理论 在各种不同的发育谱系及足够大的进化时间尺度中,在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。许多序列的进化速率几乎是恒定不变的。 两个物种的同源基因之间的差异程度与它们的共同祖两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间先的存在时间(即两者的分歧

4、时间即两者的分歧时间)有一定的数量关系。有一定的数量关系。从一个分歧数据可以推测其他从一个分歧数据可以推测其他序序 列列 分分 歧歧 度度分歧时间分歧时间xy分子钟理论分子钟理论系统发育分析的基本步骤系统发育分析的基本步骤序列有指定的来源并且正确无误。序列有指定的来源并且正确无误。序列是同源的,即所有的序列都起源于同一祖先序序列是同源的,即所有的序列都起源于同一祖先序列列(ortholog)。样本序列之间的差异包含了足以解决感兴趣的问题样本序列之间的差异包含了足以解决感兴趣的问题的信息位点。的信息位点。样本序列随机进化。样本序列随机进化。序列中的每一个位点的进化都是独立的。序列中的每一个位点的

5、进化都是独立的。选择生物学数据时的注意事项选择生物学数据时的注意事项Ortholog (直系同源基因直系同源基因):两个基因通过物种形两个基因通过物种形成的事件而产生,或源于不同物种的最近的共同祖成的事件而产生,或源于不同物种的最近的共同祖先的两个基因,或者两个物种中的同一基因,一般先的两个基因,或者两个物种中的同一基因,一般具有相同的功能。具有相同的功能。Paralog (旁系同源基因旁系同源基因):两个基因在同一物种中,两个基因在同一物种中,通过至少一次基因复制(重复)的事件而产生,常通过至少一次基因复制(重复)的事件而产生,常常具有不同的功能。常具有不同的功能。paralogsortho

6、logs直系同源基因 vs. 旁系同源基因祖先节点/树根内部节点/分歧点,该分支可能的祖先结点分支/世系末端节点 ABCDE代代表最终分表最终分类,可以是类,可以是物种,群体物种,群体,或者蛋白,或者蛋白质、质、DNA、RNA分子等分子等系统发育树系统发育树的基本特征的基本特征通通过外类群过外类群来确定树根来确定树根根根bacteria outgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea有根树有根树外类群外类群通通过外类群过外类群来确定树根来确定树根有根树有根树外类群外类群通通过外类群过外类群来确定树根来确定树根有

7、根树有根树外类群通通过外类群过外类群来确定树根来确定树根有根树eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea无根树树根确定树根确定最常用的确定树根的方法是使用一个或多个无可最常用的确定树根的方法是使用一个或多个无可争议的同源物种作为外群争议的同源物种作为外群(outgroup),这个外群要),这个外群要足够近,以提供足够的信息,但又不能太近以至于和足够近,以提供足够的信息,但又不能太近以至于和树中的种类相混。树中的种类相混。外群(outgroup)abcabc不同数目的分类群可能的有根树和无根树不同数目的分类群可能的有根树和无

8、根树考虑考虑3个分类群时,共有个分类群时,共有3种可能的有根树,种可能的有根树,1种无根树种无根树acbcbaabcdabcdabcdadbcbacdcabddabcacbdbcadcbaddbacadbcbaaccdabdcab考虑考虑4个分类群时,共有个分类群时,共有15种可能的有根树种可能的有根树abcdacbdadbc考虑考虑4个分类群时,共有个分类群时,共有3种可能的无根树种可能的无根树无根树和有根树:潜在的拓扑结构数目无根树和有根树:潜在的拓扑结构数目无根树无根树有根树有根树分类群数分类群数树树分枝分枝/ /树树树树分枝分枝/ /树树313344351565157105861059

9、94510102,027,0251734,459,42518308.69 1036574.95 103858N(2N - 5)!2N - 3 (N - 3)!2N - 3(2N - 3)!2N - 2 (N - 2)!2N - 2真实树(真实树(true tree)物种分化事件的顺序在历史上是唯一的,所以物种分化事件的顺序在历史上是唯一的,所以在用给定物种建立的所有可能的树中只有一种能代在用给定物种建立的所有可能的树中只有一种能代表真实的进化历史,这样一种系统树称为真实树。表真实的进化历史,这样一种系统树称为真实树。推测树(推测树(inferred tree)用某一组数据和某种构树法得到的树称

10、推测树,用某一组数据和某种构树法得到的树称推测树,推测树可能与真实树等同也可能与真实树不同。推测树可能与真实树等同也可能与真实树不同。分类数目增大,计算量急剧增加,因此,目前算法都为优化算法,不能保证最优解DNA序列的替换序列的替换模型模型祖先基因祖先基因XYt2t时间时间XYAAGACTTTGGACTTAAGGCCTAGGGCATTAGCCCTAGCACTTAAGGCCTTGGACTTTAGCCCATAGACTTAGCACAAAGGGCATAGGGCATTAGCCCTAGCACTTAAGACTTTGGACTTAAGGCCTAGGGCATTAGCCCTAGCACTTAAGGCCTTGGACTT

11、AGCGCTTAGCACAATAGACTTTAGCCCAAGGGCATDNA 序列进化演变序列进化演变321当前当前百万年百万年DNA序列间的差异序列间的差异 DNA序列间核苷酸的差异越少,分化时间越短;序列间核苷酸的差异越少,分化时间越短; 同一祖先序列衍生的两条后裔序列间分化的简单同一祖先序列衍生的两条后裔序列间分化的简单测度就是两条后裔序列不同核苷酸位点的比例。测度就是两条后裔序列不同核苷酸位点的比例。对于两条长度为对于两条长度为N的序列,差异位点数为的序列,差异位点数为n,则两条则两条DNA序列的替换率序列的替换率P(也可以称两条序列之间(也可以称两条序列之间的距离或差异):的距离或差

12、异):DNA序列的替换率估计序列的替换率估计P=n/N14个碱基长度,其中有个碱基长度,其中有3个位个位点发生了改变,那么这两条序点发生了改变,那么这两条序列的替换率(距离)列的替换率(距离) P=3/14DNA序列的替换率估计序列的替换率估计大多数替换估计会显著低估真正替换的数目。大多数替换估计会显著低估真正替换的数目。如在序列的同一个位点可能发生不止一次的变化。如在第在序列的同一个位点可能发生不止一次的变化。如在第7个个位置观测到位置观测到G,而在另一条序列为而在另一条序列为A, 有多种可能有多种可能 G AG C ADNA序列替换模式序列替换模式必须准确和无偏见地估计替换率;必须准确和无

13、偏见地估计替换率;数学模型可以考虑回复和平行突变等情况,尤其是数学模型可以考虑回复和平行突变等情况,尤其是在在P值较大时。值较大时。DNA序列的替换模型序列的替换模型替换模型的必要性:Jukes - Cantor 单参数模型单参数模型最简单的最简单的DNA序列进化模型:序列进化模型:假设每个核苷假设每个核苷酸酸有同样的机会有同样的机会突变为任一其它突变为任一其它核苷酸核苷酸, 突变突变几率为几率为 ;那么;那么每一个核苷酸每一个核苷酸总的替换几率为总的替换几率为3 3 。ATCGK=真正的替换率真正的替换率P=观测到的替换率观测到的替换率可以概括出大部分突变的发生情况可以概括出大部分突变的发生

14、情况Jukes-Cantor单参数模型修正替换率为: K = (- ) ln (1 *0.21) = 0.253443如观测到的替换率 7/14 =0.5, 那么单参数模型修正后的替换率更为可信: K = (- ) ln (1 *0.5) = 0.823443Jukes - Cantor 单参数模型单参数模型观测到的替换率3/14 = 0.21Kimura双参数模型双参数模型转换转换: 嘌呤嘌呤 嘌呤;嘧啶嘌呤;嘧啶 嘧啶嘧啶颠换颠换: 嘌呤嘌呤 嘧啶;嘧啶嘧啶;嘧啶 嘌呤嘌呤两类核苷酸两类核苷酸: 嘌呤(嘌呤(A,G);嘧啶:();嘧啶:(C,T和和U)同类型核苷酸间相互替换和不同类型核苷间

15、互替换同类型核苷酸间相互替换和不同类型核苷间互替换的几率不同。的几率不同。这促使了这促使了Kiumra两参数模型的产生。两参数模型的产生。转换发生的几率是颠换的三倍。转换发生的几率是颠换的三倍。Kimura双参数模型双参数模型ATCG转换发生的几率是转换发生的几率是颠换发生的几率是颠换发生的几率是K=真正的替换率真正的替换率P=观测到的转换率观测到的转换率Q=观测到的颠换率观测到的颠换率Kimura双参数模型修正替换率为:双参数模型修正替换率为: K = ln ( ) +12 1 0 1-2*0.07-0.14观测到的替换率观测到的替换率3/14 = 0.21观测到的转换率观测到的转换率1/1

16、4 = 0.07观测到的颠换率2/14 = 0.12Kimura双参数模型双参数模型14 1 0 1-2*0.14ln ( )=0.164+0.082=0.246K = (- ) ln (1 *0.21) = 0.2463443单参数模型修正:单参数模型修正:单参数和双参数模型的比较单参数和双参数模型的比较序列分化(序列差异)较小时序列分化(序列差异)较小时, , 两个模型的结果两个模型的结果基本相同;基本相同;序列分化(序列差异)较大时,双参数模型更为序列分化(序列差异)较大时,双参数模型更为准确准确, , 特别是转换率明显高于颠换率。特别是转换率明显高于颠换率。氨基酸序列的替换模型氨基酸序

17、列的替换模型氨基酸序列的进化演变氨基酸序列的进化演变 氨基酸序列较核苷酸序列更为保守,对年代跨度氨基酸序列较核苷酸序列更为保守,对年代跨度大的进化分析大多采用氨基酸序列数据;大的进化分析大多采用氨基酸序列数据; 对于编码蛋白质的基因序列对齐排列时可能需要对于编码蛋白质的基因序列对齐排列时可能需要借助氨基酸序列的校正;借助氨基酸序列的校正; 氨基酸置换模型比核苷酸置换模型简单。氨基酸置换模型比核苷酸置换模型简单。为什么研究氨基酸?为什么研究氨基酸?氨基酸序列替换率估计氨基酸序列替换率估计两条氨基酸序列的替换率两条氨基酸序列的替换率(P距离距离)为:两条序列间为:两条序列间差异氨基酸的数目(差异氨

18、基酸的数目(n)占氨基酸序列长度()占氨基酸序列长度(N)的比例:的比例:P距离距离P=n/N进化时间越长,进化时间越长,P值越大值越大氨基酸序列替换率估计氨基酸序列替换率估计不同物种间血红蛋白不同物种间血红蛋白链氨基酸差异数及比例链氨基酸差异数及比例不同物种血红蛋白不同物种血红蛋白链氨基酸序列的对齐链氨基酸序列的对齐(140个个aa的前的前60个个)进化时间进化时间氨基酸序列替换率氨基酸序列替换率期望值期望值 (实际值实际值)观测值观测值P不是很严格地与时间成比例不是很严格地与时间成比例进化时间较短时,回复突变较少,两者大致成线性关系;当进进化时间较短时,回复突变较少,两者大致成线性关系;当

19、进化时间较大时,回复突变增多,二者成非线性关系。化时间较大时,回复突变增多,二者成非线性关系。泊松校正(泊松校正(Poisson Correction)泊松校正泊松校正d=-ln(1-p),即泊松距离。,即泊松距离。TIYAPPPWSTIYTPPPWSTIYGPPPWSTIYAPPPWS例如例如该位点的丙氨酸虽然发该位点的丙氨酸虽然发生了生了3 3次变化,但我们并次变化,但我们并没有观察到这些变化没有观察到这些变化由于氨基酸存在回复突变,大多数替换估计会显由于氨基酸存在回复突变,大多数替换估计会显著低估真正替换率。著低估真正替换率。泊松校正泊松校正0.129 0.129 0.206 0.573

20、 0.6660.129 0.232 0.637 0.6520.197 0.598 0.6240.573 0.7070.753泊松校正距离泊松校正距离P距离P-距离与泊松距离比较距离与泊松距离比较进化时间进化时间氨基酸序列替换率氨基酸序列替换率期望值期望值 (实际值实际值)P距离(观测值)距离(观测值)泊松距离泊松距离1. 最大简约法最大简约法 (maximum parsimony, MP) 适用序列有很高相似性适用序列有很高相似性2. 距离法距离法 (distance) 适用序列有较高相似性适用序列有较高相似性3. 最大似然法最大似然法 (maximum likelihood, ML) 可用于

21、任何相关序列集合可用于任何相关序列集合计算速度:计算速度: 距离法距离法 最大简约法最大简约法 最大似然法最大似然法系统发育树重建基本方法系统发育树重建基本方法1. 最大简约法最大简约法根据信息位点提供的各序列间的替换情况,在所有根据信息位点提供的各序列间的替换情况,在所有可能的树中筛选含最小替换数树的方法。可能的树中筛选含最小替换数树的方法。理论基础为奥卡姆剃刀理论基础为奥卡姆剃刀(Ockham)原则:计算所需替原则:计算所需替换数最小的那个拓扑结构,作为最优树。换数最小的那个拓扑结构,作为最优树。在分析的序列位点上没有回复突变或平行突变,且在分析的序列位点上没有回复突变或平行突变,且被检验

22、的序列位点数很大的时候,最大简约法能够被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。推导获得一个很好的进化树。优点:不需要在处理核苷酸或者氨基酸替代的时候优点:不需要在处理核苷酸或者氨基酸替代的时候引入假设引入假设 (替代模型替代模型)缺点:分析序列上存在较多的回复突变或平行突变缺点:分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,可能会,而被检验的序列位点数又比较少的时候,可能会给出一个不合理的或者错误的进化树。给出一个不合理的或者错误的进化树。最大简约法(Maximum Parsimony Method)以下3个序列: 1. ACG2.

23、ACA3. GGA它们如何从一个共同祖先(GGG)进化而来?ACG ACAGGAGGGACGACGACAGGAGGGGGGACGACA GGAGGGGGA121312212最大简约法基本原则:计算一个有最小化突变事件的进化路径,作为最优树。简约信息位点:位点上至少有两种不同的核苷酸或氨基酸,且每种至少出现两次。 不变位点:在所有分类群中相同核苷酸或氨基酸的位点。 不变位点不提供任何信息。信息位点 (informative site)哪一个树是正确的?信息位点Tree 1突变位点突变位点4Tree 2突变位点突变位点5Tree 3突变位点突变位点6用最大简约法构树, 选择最小变化的拓扑树Tree

24、 1突变位点突变位点4MP tree最优结果为最优结果为Tree 1Tree 2突变位点突变位点5Tree 3突变位点突变位点6根据最大简约法构建的最优树根据最大简约法构建的最优树2. 距离法距离法又称距离矩阵法,首先通过各个物种之间的比较又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。类群之间的进化距离,构建一个进化距离矩阵。再依据进化距离,分别依次将序列合并聚类,构再依据进化距离,分别依次将序列合并聚类,构建进化树。建进化树。一种简单的距离矩阵一种简单的距离矩阵距离数据(

25、distance data) : 涉及成对基因、个体、群体或物种信息,常用距离矩阵描述,表示两个数据集之间的关系。 构树方法: UPGMA非加权分组平均法 (UPGMA, Unweighted Pair Group Method with Arithmetic mean)最近分类群分类群聚类计算平均距离构树方法构树方法: UPGMA新的距离矩阵计算:新的距离矩阵计算:如分类单元如分类单元i和和j,所形成的新的聚类群(,所形成的新的聚类群(ij),),新聚类群到其他分类单元新聚类群到其他分类单元k的距离计算如下:的距离计算如下:其中其中ni,nj,(,(ni+nj)分别为分类单元)分别为分类单元

26、i、j和(和(ij)类)类的元素个数。的元素个数。ABCDEB2C44D666E6664F888881)通过两两比较,获得一个距离矩阵 构树方法: UPGMAABECDF2) 找到距离矩阵中最小的距离,在这个例子中最小距离是A 和 BABCDEB2C44D666E6664F88888构树方法: UPGMA将 A 与 B 相连并给每一个分支赋予一半的距离。构树方法: UPGMAABECDFABCDEB2C44D666E6664F888882) 将(AB) 作为一个单元考虑,根据聚类结果来重新计算距离d(AB),C=d(AC)/2+d(BC)/2=4d(AB),D=(dAD)/2+d(BD)/2=

27、6d(AB),E=(dAE)/2+d(BE)/2=6d(AB),F=(dAF)/2+d(BF)/2=8构树方法: UPGMAABECDFABCDEB2C44D666E6664F888882) (AB) 作为一个新的聚类单元,依次计算所有影响到的距离构树方法: UPGMAABCDEC4D66E664F8888ABCDEC4D66E664F88883) 找到下一个最小的距离(D与E)构树方法: UPGMA将 D 与 E 相连并给每一个分支赋予一半的距离。构树方法: UPGMAABECDFABCDEC4D66E664F88883) 将(DE) 作为一个单元考虑,根据聚类结果来重新计算距离例如, (D

28、E) 与 (AB)的距离等同于(dAD+dAE+dBD+dBE)/4=(6+6+6+6)/4=6构树方法: UPGMAECDFABABCDEC4D66E664F88883) 依次计算所有影响到的距离构树方法: UPGMAABCDEC4DE66F888ABCDEC4DE66F8884) 继续找到下一个最小的距离(C与 (AB))构树方法: UPGMA将 C 与 (AB) 相连并给每一个分支赋予一半的距离。构树方法: UPGMADECFABABCDEC4DE66F8884) 将(AB)C) 作为一个单元考虑,根据聚类结果来重新计算距离例如, (AB)C) 和(DE)的距离等同于(dAD+dAE+d

29、BD+dBE+dCD+dCE)/6=6构树方法: UPGMADECFABABCDEC4DE66F8884) (AB)C) 作为一个新的聚类单元,依次计算所有影响到的距离构树方法: UPGMAABC DEDE6F88ABC DEDE6F885)继续找到下一个最小的距离在这个例子中 是(DE)和 (AB)C)之间的距离构树方法: UPGMA构树方法: UPGMADEFABC将 (DE)与 (AB)C) 相连并给每一个分支赋予一半的距离。ABC DEDE6F885)(AB)C)(DE) 作为一个新的聚类单元,根据聚类结果来重新计算距离构树方法: UPGMADEFABCABCDEF86) 最后一步,生

30、成UPGMA树构树方法: UPGMA如进化速率在不同分类群间近似恒定,以至进化距离与分化时间之间存在近似线性关系,则可用该方法来构建系统树。UPGMA构树方法特点UPGMA 是一种构树的简单方法,应用范围:如变化速率在各分类群间不同,则UPGMA法可能会给出错误的拓扑结构。UPGMA构树方法特点真实树的拓扑结构UPGMA构建的错误拓扑结构邻位相连法(Neighbor Joining)邻位相连法:根据距离矩阵,在所有可能的拓扑结构中,选择分支长度和最小作为最优树。通过对整个树的长度进行最小化,从而对树的拓扑结构进行了限制。CDXYUVABEF(h)(i)(d)(g)(c)(f)(b)(e)(a)

31、S:所有分支长度总和S=a+b+g+c+h+d+i+e+f最小!邻位相连法本质上是一种寻找最优拓扑结构的谱系聚类算法。同时给出系统发育树的拓扑结构以及分支的长度。优点:1、可以较快地构建系统树;2、适用于分析较大的数据集;3、能够较方便地进行自展(Bootstrap)检验。3. 最大似然法最大似然法最大似然法最大似然法(maximum likelihood, ML): 最早应用于最早应用于对基因频率数据的分析上;对基因频率数据的分析上;选取一个特定的替代模型来分析给定的一组序列数选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大据,使得获得的每一个拓扑结构

32、的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最值,然后再挑出其中似然率最大的拓扑结构作为最优树;优树;在最大似然法的分析中,所考虑的参数并不是拓扑在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长;值来估计枝长;缺点:费时,每个步骤都要考虑内部节点的所有可缺点:费时,每个步骤都要考虑内部节点的所有可能性能性改进:启发式算法,改进:启发式算法,分枝交换搜索等分枝交换搜索等1. 可靠的待分析数据可靠的待分析数据2. 准确的多序列比对准确的多序列比对3. 选择合适的建树方法:选择合适的建树方法

33、: A. 序列相似程度高,序列相似程度高,MP首先首先 B. 序列相似程度较低,序列相似程度较低,ML首先首先 C. 序列相似程度太低,无意义序列相似程度太低,无意义4. 一般采用两种及以上方法构建进化树,无显著区一般采用两种及以上方法构建进化树,无显著区别可接受别可接受构建进化树的一般原则构建进化树的一般原则进化树的可靠性分析进化树的可靠性分析单纯由预先获得的多序列比对结果数据所推导出单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。的进化树有时并不一定可靠。改进办法:引进一些统计分析来寻找更优的进化改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。树,检验结

34、果的可靠性。bootstrap评估。评估。 从排列的多序列中随机放回的抽取某一列,构成相从排列的多序列中随机放回的抽取某一列,构成相同长度的新的排列序列;同长度的新的排列序列;重复上面的过程,得到多组新的序列;重复上面的过程,得到多组新的序列;对这些新的序列进行建树,再观察这些树与原始树是对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性。否有差异,以此评价建树的可靠性。一般一般Bootstrap的值的值70,则认为构建的进化树较为可,则认为构建的进化树较为可靠;靠; Bootstrap的值的值95,认为有统计学意义。,认为有统计学意义。 自展法自展法- 进化树的可靠性分析进化树的可靠性分析Bootstrap Method

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁