电气项目工程学院生物医学项目工程生物信息学实验三DNA和蛋白质的序列分析.doc

上传人:一*** 文档编号:2552057 上传时间:2020-04-19 格式:DOC 页数:14 大小:555.85KB
返回 下载 相关 举报
电气项目工程学院生物医学项目工程生物信息学实验三DNA和蛋白质的序列分析.doc_第1页
第1页 / 共14页
电气项目工程学院生物医学项目工程生物信息学实验三DNA和蛋白质的序列分析.doc_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《电气项目工程学院生物医学项目工程生物信息学实验三DNA和蛋白质的序列分析.doc》由会员分享,可在线阅读,更多相关《电气项目工程学院生物医学项目工程生物信息学实验三DNA和蛋白质的序列分析.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、!- 生物信息学生物信息学 实验三、实验三、DNADNA 和蛋白质的序列分析和蛋白质的序列分析 !- 一、实验目的: 1、掌握序列分析的基本分析方法 2、熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析) 3、了解基因的电子表达谱分析 二、实验设备: PC 机,Matlab 实验环境,Internet 网络;BioEdit 和 DNAClub 软件 三、实验步骤: 1、核酸分析: (1)调用 Internet 浏览器,并在其地址栏输入 Entrez 网址: http:/www.ncbi.nlm.nih.gov/gquery/gquery.fcgi; (2)在输入栏输入 homo

2、sapiens leptin; (3)点击 go 后显示搜索结果; (4)在搜索结果中选择 nucleotide 前的数字,显示序列接受号及序列名称等; (5)查找人 leptin (obesity homolog, mouse) mRNA 序列(提示:NM_000230) ,点击 序列接受号后显示序列详细信息; (6)将序列转为 FASTA 格式保存 (7)根据从 NM_000230 了解的基因定位信息查找人瘦素的基因组 DNA (Contig) 的 序列接受号及序列识别号,点击序列接受号显示序列详细信息; (8)在输入栏输入 homo sapiens leptin exon 查找人瘦素外显

3、子序列; (9)根据从 NM_000230 了解的 HGNC:6553,进入 GENATLAS 查找人瘦素 5调 控区序列(提示:从 10 Kb 5 upstream gene genomic sequence study 查找); (10)按上述步骤用 SRS 信息查询系统检索人瘦素 (leptin) 的 mRNA、基因组 DNA、外显子和 5调控区 (promoter) 等核酸序列; (11)将上述核酸序列输入 BioEdit 和 DNAClub 软件进行序列基本分析; (12)打开 BioEdit 软件,点击“help”栏,阅读“contents” ; (13)将人瘦素 (leptin)

4、 的 mRNA 序列输入 BioEdit 软件进行可读框架分析:打开 BioEdit 软件将人瘦素 (leptin) mRNA 的 FASTA 格式序列输入分析框点击左侧 序列说明框中的序列说明点击 sequence 栏选择 nucleic acid点击 find next ORF查看起始密码位置和编码区范围(57557) ; (14)人瘦素 (leptin) mRNA 序列与其外显子或基因组序列的比对分析:调用 Internet 浏览器并在其地址栏输入 Blast2 网址 (http:/www.ncbi.nlm.nih.gov/Entrezgorf/bl2/html) 将人瘦素 (lepti

5、n) mRNA 和外显子 的 FASTA 格式序列分别输入 sequence2 和 sequence1 分析框或将人瘦素 (leptin) mRNA 和基因组序列的 GI 版本号输入 sequence2 和 sequence1 的 GI 版本号框点击 Align 后显示两序列比对的详细信息查找 mRNA 序列上各外显子的位置。 2、序列分析: (1)先打开网址 http:/www.ncbi.nlm.nih.gov/ (2)点击右边的 Blast 链接,打开 Blast 数据库,进入 Blast 界面 (3)在 Basic Blast 中选择 nucleotide blast !- (4)在对话

6、框中输入核苷酸序列,在 choose search set 下的 Database 选项中选 Others (nr etc.) (5)把网页拉到最下方,点击 Blast 按钮 (6)在 Descriptions 栏下找到 Max ident 百分率最高的序列名称 !- (7)再往下拉,找到 Alignments 项下第一个序列,可以找到输入序列相关信息 (8)点击 Accession,即能找到更多输入序列的相关信息。 四、思考题 1、归纳对人瘦素(leptin)的核酸序列分析的结果,列出主要的分析结果。 !- !- !- !- !- !- !- !- ORIGIN 1 GTAGGAATCGGT

7、AGGAATCG CAGCGCCAGCCAGCGCCAGC GGTTGCAAGGGTTGCAAGg taaggccccg gcgcgctcct tcctccttct 61 ctgctggtct ttcttggcag gccacagggc cccacacaac tctggatccc ggggaaactg 121 agtcaggagg gatgcagggc ggatggctta gttctggact atgatagctt tgtaccgagt . 10681 ctccttgcag tgtgtggttc cttctgtttt cagGCCCAAGGCCCAAG AAGCCCATCCAAGCCCATC

8、C TGGGAAGGAATGGGAAGGAA 1074110741 AATGCATTGGAATGCATTGG GGAACCCTGTGGAACCCTGT GCGGATTCTTGCGGATTCTT GTGGCTTTGGGTGGCTTTGG CCCTATCTTTCCCTATCTTT TCTATGTCCATCTATGTCCA 1080110801 AGCTGTGCCCAGCTGTGCCC ATCCAAAAAGATCCAAAAAG TCCAAGATGATCCAAGATGA CACCAAAACCCACCAAAACC CTCATCAAGACTCATCAAGA CAATTGTCACCAATTGTCAC 108

9、6110861 CAGGATCAATCAGGATCAAT GACATTTCACGACATTTCAC ACACGACACGgtaag gagagtatgc ggggacaaag tagaactgca 10921 gccagcccag cactggctcc tagtggcact ggacccagat agtccaagaa acatttattg . 13021 aggcagccca gagaatgacc ctccatgccc acggggaagg cagagggctc tgagagcgat 13081 tcctcccaca tgctgagcac ttgttctccc tcttcctcct gcata

10、gCAGTCAGT CAGTCTCCTCCAGTCTCCTC 1314113141 CAAACAGAAACAAACAGAAA GTCACCGGTTGTCACCGGTT TGGACTTCATTGGACTTCAT TCCTGGGCTCTCCTGGGCTC CACCCCATCCCACCCCATCC TGACCTTATCTGACCTTATC 1320113201 CAAGATGGACCAAGATGGAC CAGACACTGGCAGACACTGG CAGTCTACCACAGTCTACCA ACAGATCCTCACAGATCCTC ACCAGTATGCACCAGTATGC CTTCCAGAAACTTCCA

11、GAAA !- 1326113261 CGTGATCCAACGTGATCCAA ATATCCAACGATATCCAACG ACCTGGAGAAACCTGGAGAA CCTCCGGGATCCTCCGGGAT CTTCTTCACGCTTCTTCACG TGCTGGCCTTTGCTGGCCTT 1332113321 CTCTAAGAGCCTCTAAGAGC TGCCACTTGCTGCCACTTGC CCTGGGCCAGCCTGGGCCAG TGGCCTGGAGTGGCCTGGAG ACCTTGGACAACCTTGGACA GCCTGGGGGGGCCTGGGGGG 1338113381 TGTCCTG

12、GAATGTCCTGGAA GCTTCAGGCTGCTTCAGGCT ACTCCACAGAACTCCACAGA GGTGGTGGCCGGTGGTGGCC CTGAGCAGGCCTGAGCAGGC TGCAGGGGTCTGCAGGGGTC 1344113441 TCTGCAGGACTCTGCAGGAC ATGCTGTGGCATGCTGTGGC AGCTGGACCTAGCTGGACCT CAGCCCTGGGCAGCCCTGGG TGCTGATGCTGAGGCC TTGAAGGTCA 13501 CTCTTCCTGC AAGGACTACG TTAAGGGAAG GAACTCTGGC TTCCAGGT

13、AT CTCCAGGATT . 16081 CACTAGATGG CGAGCATCCT GGCCAACATG GTGAAACCCC GTCTCTACTA AAAACACAAA 16141 AGTTAGCTGA GCGTGGTGGC GGGCGCCTGT AGTCCCAGCC ACTCGGGAGG CTGAGACAGG 16201 AGAATCGCTT AAACCTGGGA GGCGGAGAGT ACAGTGAGCC AAGATCGCGC CACTGCACTC 16261 CGGCCTGATG ACAGAGCGAG ATTCCGTCTT AAAAAAAAAA AAAAAAAAGT TTGTTTT

14、TAA 16321 AAAAATCTAA ATAAAATAAC TTTGCCCCCT GC 2、总结核酸序列分析的基本步骤,相互对比结果,指出应注意的事项。 答: 序列比对的数学模型大体可以分为两类,一类从全长序列出发,考虑序列的整 体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。局部相 似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部 位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。 此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。 区分这两类相似性和这两种不同的比对方法,对于正确选择比对方法是十分重

15、 要的。应该指出,在实际应用中,用整体比对方法企图找出只有局部相似性的两个 序列之间的关系,显然是徒劳的;而用局部比对得到的结果也不能说明这两个序列 的三维结构或折叠方式一定相同。 BLAST 和 FastA 等常用的数据库搜索程序均采用局部相似性比对的方法,具有较 快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用 计算机才能实现。 3、如需初步分析一个基因片段是什么基因,编码什么产物以及是否已经被别人克隆, 应该采用什么工具和数据库? (Blastn; Blastp; tblastn; tblastx; blastx; nr; EST; nr/nt) 答: 分析基因片

16、段是什么基因采用 Blastn 分析编码是什么产物使用 blastx 分析该基因是否已被别人克隆使用 tBLASTn 4、序列分析的方法有哪些? (1)通过 NCBI 的 Entrez 系统进行检索,检索时在 NCBI 首页 (http:/www.ncbi.nlm.nih.gov/)搜索项中选择“Nucleotide” ,在输入框中输入 检索的内容,检索的内容可以是序列号,也可以是关键词,输入后点“go” 。 (2)核酸序列的分子质量、碱基组成、碱基分布等分析可以通过一些常用软件如: DNAMAN、Genetool、DNAStar 等进行。 (3)限制型酶切分析是分子生物学实验中日常工作之一。

17、限制酶数据库提供了较全 面的限制酶相关信息。地址为: 多数分子生物学软件都具有限制性酶切分析功能,完全可以轻松地实现限制性酶切 !- 分析功能,这方面的软件如:DNAMAN、Bioedit、DNAStar 软件包等 (4)许多数据库中收集了常用的测序载体序列,使用 Blast 程序对此类数据库进行 相似性分析即可得知目的序列中是否含有载体序列。如果是,在对测序数据进行进 一步分析之前必须将载体序列去除。此过程虽然很简单,在核酸序列数据库中仍然 有一些序列含有载体序列污染。NCBI 的载体识别程序 http:/www.ncbi.nlm.nih.gov/VecScreen/VecScreen.ht

18、ml EMBL 的载体识别程序 http:/www.ebi.ac.uk/blastall/vectors.html 核酸序列综合分析的其他软件: BioEdit 软件是一个性能优良的免费分子生物学应用软件,它的基本功能是提供蛋白 质核酸序列的编辑排列处理和分析。 EBI tools 欧洲生物信息学研究所(EBI)提供了许多生物信息学在线分析工具,包括如下几大 类: 相似性和同源性分析:如 BLAST 和 FASTA 程序 蛋白质功能分析:如 InterProScan 可查询蛋白质序列中的特殊模块 序列分析:如 ClustalW 程序 结构分析:如 MSDfold 和 DALI 可分析蛋白质的结

19、构并与 PDB 数据库的信息进行比较 其他商业软件:DNAStar 、Omiga、Vector NTI Suite、 (6)引物分析软件 Primer Premier、Oligo 6.57 、Primer3 (7)基因定位软件 Forward electronic PCR & Reverse electronic PCR 查找 DNA 序列的 STSs(sequence tagged sites,序列标签位点)的在线工具软件。 5、如何识别某一长序列中的 CpG 岛的位置? CpG 岛:是一些富含 GC 的小区域,大小范围为 0.55kb,基因中平均每 100kb 即可出现。因这些区域未发生甲基化,故富含 CpG(6070),目前认为,基因表达 与 CpG 岛甲基化程度呈负相关。CpG 岛经常在脊椎动物基因的 5区域发现,其中 80的人类基因的转录起始位点前存在 CpG 岛。因此相对于寻找结构复杂的转录起 始位点和基因的 5端,CpG 岛是发现基因的重要线索,特别是通过 cDNA 法难以实 现时更是如此。登录以下网址:http:/www.ebi.ac.uk/emboss/cpgpl

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 施工组织

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁