《系统发育分析方法ppt课件.pptx》由会员分享,可在线阅读,更多相关《系统发育分析方法ppt课件.pptx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、刘芳2015.12.11系统发育分析系统发育分析方法方法系统发育分析常用方法系统发育分析常用方法一、基于距离方法基于距离方法 Distance based (Algorithmic) methods二、基于特征符方法基于特征符方法 Character based (Tree searching) methodsMaximum parsimony (MP)Maximum likelihood (ML)Bayesian inference (BI)unweighted pair group method with arithmetic mean (UPGMA)Neighbor-Joining Me
2、thod (NJ)Minimum Evolution (ME) Fitch-Margoliash Method (FM)方法方法基本特征基本特征适用范围适用范围优点优点缺点缺点NJ不需要分子钟假设,是基于最小进化原理,进行类的合并时,不仅要求待合并的类是相近的,而且要求待合并的类远离其他的类。远缘序列,进化距离不大,信息位点少的短序列假设少,树的构建相对准确,计算速度快,只得一颗树,可以分析较多的序列,运行速度优于最大简约法序列上的所有位点等同对待,且所分析的序列的进化距离不能太大MP基于进化过程中碱基替代数目最少这一假说,不需要替代模型,对所有可能的拓扑结构进行计算,并计算出所需替代数最小的
3、那个拓扑结构,作为最优树近缘序列物种序列的数目12.善于分析某些特殊的分子数据如插入、缺失等序列有用。只适于序列数目N12。存在较多回复突变或平行突变时,结果较差。变异大的序列会出现长枝吸引而导致建树错误。ML依赖于某一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。特定的替代的模,远缘序列很好的统计学基础,大样本时似然法可以获得参数统计的最小方差,在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法.所有可能的系统发育树都计算似然函数,计算量大,耗时时间长。依赖于合适的替代模型,BI基因进化模型的统计
4、推论法,通过后验概率直观反映出各分支的可靠性而不需要自检法检验大而复杂的数据集具有坚实的数学和统计学基础,可以处理复杂和接近实际情况的进化模型对进化模型比较敏感,后验概率是建立在许多假说上,在现实中可能不成立http:/evolution.genetics.washington.edu/phylip/software.html系统发育树构建的软件系统发育树构建的软件常见软件常见软件软件名称软件名称用途用途DNAMAN序列分析的综合工具序列分析的综合工具BioEdit 序列分析的综合工具序列分析的综合工具DNASTAR序列分析的综合工具序列分析的综合工具MAFFT多重序列比对工具多重序列比对工具
5、Muscle多重序列比对工具多重序列比对工具ClustalX图形化的多序列比对工具图形化的多序列比对工具; ;构建构建N-JN-J系统树系统树Gblocks冗余序列处理工具冗余序列处理工具jModelTest, ModelTest, ModelGenerator进化模型选择工具进化模型选择工具PHYLIP集成的进化分析工具集成的进化分析工具MEGA图形化、集成的进化分析工具图形化、集成的进化分析工具PAUP集成的进化分析工具集成的进化分析工具PHYML, PAML, RAxMLMLML建树工具建树工具MrBayes基于贝叶斯方法的建树工具基于贝叶斯方法的建树工具TreeView进化树显示工具进
6、化树显示工具FigTree, Adobe Illustrator进化树显示和编辑工具进化树显示和编辑工具系统发育树构建的过程系统发育树构建的过程多序列比对多序列比对 (MAFFT)进化模型的选择进化模型的选择 (ModelTest)系统发育树的构建系统发育树的构建 (RAxML, MrBayes, PAUP)系统发育树显示和编辑系统发育树显示和编辑 (FigTree, Adobe Illustrator)序列拼接序列拼接 (Mega)序列拼接序列拼接 BioEdit Mega Seqman Contig Sequencer多序列比对多序列比对http:/mafft.cbrc.jp/alignm
7、ent/server/速度:速度: MuscleMAFFTClustal比对比对准确性:准确性:MAFFTMuscleClustal比对前MAFFT 7.0 online alignmenthttp:/mafft.cbrc.jp/alignment/server/index.htmlPAUP软件使用流程软件使用流程 (系统树构建)(系统树构建)1. 将比对后的将比对后的fasta格式文件转换成格式文件转换成Nexus格式格式2. 将将paup命令粘贴到命令粘贴到Nexus文件下方,在命令程序中指定外群,文件下方,在命令程序中指定外群,保存。保存。begin paup; log file=p_b
8、uffer.txt; pset collapse=minbrlen; ctype 1.5_1:all; set maxtrees=5000 increase=no; outgroup *; set criterion=parsimony; hsearch addseq=random nreps=1000; roottrees outroot=monophyl; savetrees brlens=yes file=MP.tre; pscores ALL/ci=yes tl=yes hi=yes rc=yes ri=yes khtest=yes; bootstrap nreps=1000 Keep
9、all=yes / AddSeq=random nreps=10; roottrees outroot=monophyl; savetrees file=BT.tre from=1 to=1 savebootp=both maxdec=0; end;转换文件格式转换文件格式.3.打开打开paup软件,打开软件,打开Nexus文件然后运行即可。文件然后运行即可。 4. 运行界面。运行界面。MP树运行完后,点击树运行完后,点击“Stop”,继续运行,继续运行BT树。树。运行结果文件:MP树BT树P-buffer 文件RAxML建树建树Page 26 程序自带的文件: raxmlHPC、 raxml
10、HPC-PTHREADS、 run 三个 准备文件两个:phy格式的比对好的序列, txt格式的partition文件Run 文件基因的名字和序列所在位置跑多少次比对好序列的文件名字输出结果的的名字Partition文件的名字Partition 文件MrBayes建树建树(Mrmodeltest 2.3和Mrbayes 3.2.2)http:/ 3.2.2 fixes a number of bugs in previous releases of version 3.2. mrbayes_x86.exe for 32 bit system, mrbayes_x64.exe for 64 bi
11、t system操作步骤操作步骤 1. Fasta文件转换成Nexus格式的文件 2. 把Mrmodelblock文件夹中对应的MrModelblock*loci文件中的内容粘贴到Nexus文件最下方(几个基因即对应几个loci的文件,比如4个基因,则需要复制MrModelblock4loci 中的内容) 3. 修改刚刚粘贴的命令参看文件红色框中是要修改的地方 4. Paup运行刚刚修改好的Nexus文件,得到SCORES文件 5. 将SCORES文件复制到MrModeltest2.3文件夹中,此时该文件夹包含以下文件: 6. 运行cmd 得到txt文件 7. 打开刚刚得到的txt文件,从每一
12、个txt文件中找到如下Bayes的模型: 8. 把得到的models复制到一个text文本中 9. 打开之前的NEXUS文件,删掉mrmodeltest命令, 粘贴bayes命令:begin mrbayes;This block sets up several different partitions that could be used in the analysis of this dataset outgroup M_infuscans_CBS_869_96; replace fungusX with your outgroup taxonWhen defining your chars
13、ets below, the characters must follow each other directly, e.g. 1-300, 301-500, 501-600 and not 5-300, 325-500, 530-600. You will excluded everything you do not want to include in the analysis (e.g. 1-4, 301-324 and 501-529 in the charset excludedcharacters line.charset locus1 = 1-286; replace the x
14、xs with numbers reflecting the character spanning of your gene 1charset locus2 = 287-605; replace the xxs with numbers reflecting the character spanning of your gene 2charset locus3 = 606-1159; replace the xxs with numbers reflecting the character spanning of your gene 3 charset locus4 = 1160-1678;
15、replace the xxs with numbers reflecting the character spanning of your gene 4 charset excludedchars = 282-286 601-605 1155-1159 1674-1678; list here all of the characters that you do not want to include. e.g. the bits between the lociexclude excludedchars;partition AllLoci = 4: locus1, locus2, locus
16、3, locus4;log start filename=mydata.log;end;begin mrbayes;outgroup M_infuscans_CBS_869_96;set partition= AllLoci;prset applyto=(1,2,4) statefreqpr=dirichlet(1,1,1,1); This means locus1 and locus3 are sameprset applyto=(3) statefreqpr=fixed(equal); This is the model of locus2lset applyto=(1,2) nst=2
17、rates=gamma;lset applyto=(3,4) nst=2 rates=propinv;unlink shape=(all) pinvar=(all) statefreq=(all) revmat=(all);mcmcp ngen= 10000000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes stoprule=yes stopval=0.01;mcmc;sumt conformat=simple; using Mrbayes3.2.1 should a
18、dd conformat=simpleend;红色字体文字是需要修改的地方;蓝色字体视情况修改,也可不修改。 10. 把修改好的NEXUS文件放在Mrbayes文件夹中,打开Mrbayes,输入命定 : exe NEXUS的文件名.nex 11. OverCIPRES在线建树在线建树CIPRES 在线建ML树(RAxML)http:/www.phylo.org/portal2/login!input.actionCreate new folder Upload dataCreate new taskSelect toolsSet parameters最开始可以先输入=0.5ResultCIPR
19、ES 在线建贝叶斯树如果上传的NEXUS文件中不包含不包含贝叶斯的命令,按照上图红色方框的内容设置。点击“Advance Parameters”,然后设置其他的命令(类似我们用的贝叶斯命令,只是将命令程序改成了选项,即选择题.)Setparameters根据情况设定时间,可以先设0.5试一下Set parameters如果上传的NEXUS文件中已包含已包含了贝叶斯的命令,则按照上图设置。 可以先设0.5试一下ResultFigtree/Treeview 打开系统发育树打开系统发育树系统发育树的编辑(系统发育树的编辑(Adobe Illustrator,PPT)Here comes your footer Page 54iTol (Interactive Tree of Life)http:/itol.embl.de/Thanks for your attention!