《二代测序实验与测序原理ppt课件.ppt》由会员分享,可在线阅读,更多相关《二代测序实验与测序原理ppt课件.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益二代测序的建库与测序原理二代测序的建库与测序原理何有裕何有裕上海生物信息技术研究中心上海生物信息技术研究中心上海众信生物技术有限公司上海众信生物技术有限公司苏州众信生物技术有限公司苏州众信生物技术有限公司为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益内容样本处理与测序原理简介罗氏454Illumina solexa原始数据质量控制为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用
2、制度,保障用人单位和职工的合法权益TRUSEQ RNA AND DNA SAMPLE PREPARATION为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益CLUSTER GENERATION OVERVIEW 1000-6000 molecules per cluster 为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益OHOHflowcelldiol P7 P5 Cluster Generation,Template Hybridizationdioldi
3、olTemplate hybridizationdioldiol Initial extensiondioldiol Denaturation为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益dioldiol1st cycle denaturation1st cycle annealingdioldioln=251st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldiolCluster Generation,Bri
4、dge PCRdioldioldiol2nd cycle extension为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益TEMPLATE PREPARATION-BRIDGE RCRAdaptor ligationSurface attachmentBridge amplificationDenaturationTrends in Genet 24:133(2008)为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益CAGTCATCACCTAGCGTA5GT
5、CAGTCAGTCAGT35First base incorporatedCycle 1:Add sequencing reagentsDetect SignalCleave Terminator and DyeCycle 2-n:Add sequencing reagentsand repeatSEQUENCING BY SYNTHESIS OVERVIEW为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益CYCLIC REVERSIBLE TERMINATIONAll four labeled reversible term
6、inators are added per cycleRemove unincorporated bases and detect signalRemove the terminating group and the fluorescent dyeTrends in Genet 24:133(2008)Terminating groupFluorophore cleavageNat Rev Genet 11:31(2010)为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益BASE CALLING为了规范事业单位聘用关系,建立和
7、完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益FLOWCELL LAYOUT ON GAIIA flow cell contains 8 lanes Lane 1Lane 2Lane 8.Column 1Column 2TileEach lane contains 2 columnsEach column contains 60 tilesEach tile is imaged 4 times per cycle为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益PRIMARY DATA AN
8、ALYSIS BY FIRECREST AND BUSTARD IN RTA/OLB tiff image fileIntensity fileFirecrestBustardX,YA C G TCycle 1Cycle 2PositionTile#Lane#A C G TX,YLane#SequenceSequence file为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益OHdioldiolOHCluster Generation,Sequencing Primer Hybridization(Single测序方式处理步
9、骤)LinearizationOHBlocking with ddNTP()Denature and HybridizationSBS3OH为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益SEQUENCE MULTIPLE SAMPLES IN THE SAME LANESDNA insertRead 1Index ReadRead 2DNA insertIndexIndex SPRd2 SPRd1 SPMultiplexing multiple samples in the same lanes为了规范事业单位聘用关系,建立
10、和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益PAIR-END 测序优势Read 1Read 2Known DistanceRepetitive DNASingle read maps to multiple positionsPaired read maps uniquely为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益MATE-PAIR 建库和测序Read 1Read 2Known DistanceMolecular Ecology Resources(2011)为了规范事业单位聘
11、用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益TEMPLATE PREPARATION-EMULSION PCRTrends in Genet 24:133(2008)FragmentationLigationWater-in-oil emulsionMirco-reactoremPCRPicoTiter Plate loading为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益PYROSEQUENCINGSingle dNTP type flows per cycleIno
12、rganic pyrophosphate(PPi)drives visible light through a series of reactionsRemove unincorporated nucleotideTrends in Genet 24:133(2008)为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益BASE CALLINGHomopolymer errorGV6330为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益灵活的多样本标签技术Prim
13、er AMIDKeyLibrary fragmentPrimer BSequencing primer2020为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益454、SOLEXA测序模式454solexaSingleSingle或什么都不说Pair endPair endMate pair为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益Detect H+released as a voltage changefast Common microchip desi
14、gn standardslow-cost manufacturingSequencing volume is increasing Semiconductor sequencing为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益FASTA序列格式序列格式 Fastq 文件用4行记录一条序列l 第一行以字符开头,跟在后面的是序列标识和描述l 第二行是序列字符l 第三行以+字符开头,后面可以为空,或者和第一行一样l 第四行是第二行序列质量数据的编码,长度需和第二行一样HWI-ST507:211:C18E6ACXX:2:1101:1
15、688:1992 1:N:0:GAGTGGCGACAATTTTTTTTGATATTAATAAAGATAGAACTTTCTTCCTATGAGTTTTCTCTC+CCCFFDFFHHHHGJJGHIIJGIIJJJJIIJJHJJJJJIJJIIIGIIIJGGIHJDIJIGAHEHFFGHGHEExample:为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益ILLUMINA SEQUENCE IDENTIFIERSHWI-EAS364_0004:4:1:995:9044#0/1HWI-EAS364_0004仪器唯一名称仪器唯一
16、名称4Flowcell Lane1在Flowcell Lane中Tile编号995在Tile中簇的x坐标9044在Tile中簇的y坐标#0混合样本中的index编号(0代表没有index)/1Pair配对的成员Casava 1.8以前的序列标识以前的序列标识为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益ILLUMINA SEQUENCE IDENTIFIERSHWI-ST507:211:C18E6ACXX:2:1101:1688:1992 1:N:0:GAGTGGHWI-ST507仪器唯一名称仪器唯一名称211Run IDC
17、18E6ACXXFlowcell ID2Flowcell Lane1101在Flowcell Lane中Tile编号1688在Tile中簇的x坐标1992在Tile中簇的y坐标1Pair配对的成员(1 或者 2)NRead是未通过过滤(Y:read是坏的,N:read是好的)0Control bits,0表示control bits没有设置GAGTGGIndex序列Casava 1.8的序列标识的序列标识为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益序列质量序列质量附:Solexa 1.3以前的quality计算公式是:Qu
18、ality计算:Q是用phred quality score的计算方式计算得到:p是对应的碱基call错的概率计算得到的Q值是一个整数,将这个Q值加上33或者64后再转换成ASCII字符为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS.XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII.JJJJJJJJJJJJJJJJJJ
19、JJJJJJJJJJJJJJJJJJJJJ.LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL.!#$%&()*+,-./0123456789:;?ABCDEFGHIJKLMNOPQRSTUVWXYZ_abcdefghijklmnopqr|33 59 64 73 1040.26.31.40 -5.0.9.40 0.9.40 3.9.40 0.26.31.41 S-Sanger Phred+33,raw reads typically(0,40)X-Solexa Solexa+64,raw reads typically(-5,40)I-Illumina 1.3
20、+Phred+64,raw reads typically(0,40)J-Illumina 1.5+Phred+64,raw reads typically(3,40)with 0=unused,1=unused,2=Read Segment Quality Control Indicator(bold)(Note:See discussion above).L-Illumina 1.8+Phred+33,raw reads typically(0,41)Q值对应值对应ASCII码码为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法
21、权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益454原始数据图片、SFF格式、FASTA格式(QUAL)HSAPGDX01D1KDA length=181 xy=1540_3788 region=1 run=R_2012_08_01_00_39_39ACGTGTTCTGAGCCATATTGCG
22、GTACTGGAAGGTGCGCCTGCACTGTCTGAGCACTGGTCACTGCTCGATACCAATGAAGCCTTATTTGATGAGGCGCGCACCACGCAGGCGGCGACTATTATCTTCTCGTTTGATCCAGAATAACCAAATCGAAAACGCTGGCAAGGCACACAGGGGATAHSAPGDX01D1KDA length=181 xy=1540_3788 region=1 run=R_2012_08_01_00_39_3940 40 40 40 40 40 40 39 37 38 36 34 24 23 19 19 19 24 20 19 18 18 26
23、 26 18 18 19 18 20 20 20 25 25 26 19 20 20 22 22 22 25 28 26 24 22 22 22 25 24 28 28 28 29 29 28 30 30 30 26 2626 27 27 27 31 31 30 28 28 28 30 30 30 30 26 21 21 20 20 26 27 28 24 25 20 20 20 20 19 19 19 27 28 28 30 30 31 30 28 28 30 31 31 32 32 31 31 30 30 30 31 27 24 24 22 20 20 20 22 2626 22 22 2
24、3 16 16 16 19 22 16 13 13 13 16 22 23 23 23 26 26 24 24 26 13 13 11 11 12 12 19 22 18 18 11 11 13 13 18 24 24 24 24 26 26 26 27 29 29 31 33 32 31 31 27 27 27 29 29 28 2622为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益454原始数据长度分布(质控后一样)为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工
25、的合法权益Yield,data size produced by sequencer.Reads,sequenced fragments.Read length and quality.Coverage fold,number of times a nucleotide is represented.Depth,the average coverage fold.Coverage rate,ratio of the region sequenced to the whole genome.Homopolymer,e.g.AAAAAKey lab of systems biologySIBS,C
26、hinese Academy of Sciences一些测序中提到的基本概念为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益通常深度测序数据处理流程Key lab of systems biologySIBS,Chinese Academy of SciencesImage dataSCS,IPAR,PipelineQuality controlStatistics calculationCoverage,depth,mapping efficiency Basic analysis procedureConsideratio
27、nCommon softwareData filteringSeqclean,lucy,fastx-toolsLength&QualitySequences dataQuality calibrated Sff_extract scriptAssembly(no reference)Mapping(with reference)Bowtie,SOAP,Bwa,SSAHA2CAP3,gassembler,MIRA,CeleraAdvanced AnalysisDifferent applicationSNP:MAQ,Pyrobayes,ssahasnp,QualitySNPGene foreca
28、st:Glimmer,glimmerHMMGene annotation:Blast,wublast,为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益序列质量评估 FastQC:A quality control tool for high throughput sequence data Java http:/www.bioinformatics.bbsrc.ac.uk/projects/fastqc/Function:为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工
29、的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益QC PI
30、PELINERaw readsFormat conversionFilter low-quality reads Trim low-quality ends QC reportAnalysis-ready reads PassFail为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益原始数据的质控过滤Sequence level Short sequences Adaptor/primer polyA|T region Overall low-complexity sequence(Dust)Contamination/unwa
31、nted sequences Ns(low quality ends)Quality level Low quality base or region 目标:所有保留的都是高质量的,真正参与生物信息分析的数据。为了规范事业单位聘用关系,建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度,保障用人单位和职工的合法权益CLEAN READS去掉含有接头序列的reads;当单端测序read中含有的N的含量超过该条read长度比例的10%时,去除此对paired reads;当单端测序read中含有的低质量(低于5)碱基数超过该条read长度比例的50%时,需要去除此对paired reads。Reads中不合格的碱 基判断标准:reads中出现N,记个数reads中碱基质量分数低于20分,记个数去除的reads条件:质 量不合格的碱基占reads长度的10%以 上(即10bp)没 有3接 头的reads5接头污染的reads没 有插入判断的reads