《生物信息学考试复习(共9页).doc》由会员分享,可在线阅读,更多相关《生物信息学考试复习(共9页).doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上古A 名词解释1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。3. NCBI:National Center for Biotechno
2、logy Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。7. BLAST:Basic Local Alignment Search Tool. 是通过比对(alignment)在数据库中寻找和查询序列(query)相似度
3、很高的序列的工具。8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。10. motif:模体,基序,
4、是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。14. 非编码RNA:是指没有编码蛋白质功能的所有RNA,它缺乏ORF,常有编码蛋白质的基因反义转录而来。15. miroRNA:是含有茎环结构的miRNA前体,经过Dicer加工之后的一类非编码的小RNA分子(21-23 nt)。16.RNAi:是指在进化过程中高度保守的、由双链RNA(double-stra
5、nded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。是一种转录后水平的基因沉默(PTGS)B简答题1.生物信息学研究内容。答:(1)生物信息的收集、存储、管理和提供。(2)基因组序列信息的提取和分析。(3)功能基因组分析。(4)生物分子设计。(5)药物设计。(6)生物信息分析的技术与方法研究。(7)应用与发展研究。(8)系统生物学研究。2.生物信息学的应用。答:(1)人类基因组计划。(2)人类蛋白质组计划。(3)新药开发中的应用。(4)基因芯片。(5)医学应用。3.已测序五个植物物种,属名加种名。答:(1)Solanum tuberosum 马铃薯(2)Musa acumi
6、nata banana 香蕉(3)Solanum lycopersicum 番茄(4)Zea mays 玉米(5)Oryza sativa 水稻(6)Arabidopsis thaliana 拟南芥(7)Vitis vinifera 葡萄(8)Brassica rapa 白菜4.已测序五个动物物种,属名加种名。答:(1)Homo sapiens 人(2)Danio rerio 斑马鱼(3)Mus musculus 小鼠(4)Drosophila melanogaster 黑腹果蝇(5)Caenorhabditis elegans 秀丽隐杆线虫(6)Felis catus 猫(7)Gallus
7、gallus 鸡(8)Apis mellifera 蜜蜂5.画图阐述原核生物基因结构。6.画图阐述真核生物基因结构。7.核酸序列分析的应用。答:(1)常规分析:A.核酸序列检索B.核酸序列组分分析C.序列变换D.限制性酶切分析E.序列注释(2)比对分析:A.BLAST比对 B.双序列比对 C.多序列比对(3)基因结构的识别:A. ORF识别及其可靠性验证 B.重复序列分析 C.非编码区及启动子分析 D.其它调控位点分析:a.转录因子结合位点分析 b.剪接位点分析。8.如何做比对分析(BLAST)?答:(1)进入NCBI主页,点击BLAST进入BLAST主页。(2)选择需要比对的类型 BLAST
8、N BLASTP BLASTX tBLASTN tBLASTX (3)在序列框中输入需要比对的序列。(4)选择数据库。(5)开始比对。9.基因结构识别包括哪些内容?答:(1)ORF识别及其可靠性验证(2)非编码区及启动子区分析(3)基因组重复序列分析(4)其它调控位点分析:a.转录因子结合位点分析b.剪接位点分析。10.蛋白质序列的基本性质分析包括哪些内容?答:(1)理化性质分析(2)亲水性/疏水性分析(3)跨膜区分析(4)信号肽预测(5)Coil区分析(6)亚细胞定位(7)结构功能域分析11.蛋白质空间结构怎么预测,二级/三级。答:(1)二级结构预测:使用SSPro 4.0或PORTER进行
9、分析预测。(2)三级结构预测:主要方法有同源模建、折叠识别和从头预测。目前主要使用同源模建的方法来预测蛋白质三级结构,但是需要二个蛋白质序列同源性高于35%,低于30%结构不理想。具体步骤为,a.进入SWISS-MODEL主页b.选择Automated Mode进入c.在序列框中输入蛋白质序列d.确认进行预测12.如何判断一个新的基因?答:(1)从一个新蛋白质序列开始,通过tBLASTn搜索核酸数据库,找到相应的匹配,如果是和DNA编码的已知蛋白质匹配,则可能不是新的基因;但是如果找到与DNA编码的相关蛋白质的匹配,则有可能是新的基因。(2)然后进一步通过BLASTx或BLASTp在核酸,蛋白
10、数据库中搜索DNA或蛋白质序列来进一步确定新的基因。13.进化树构建过程,方法。答:(1)进行多序列比对,确定序列之间的相似性。(2)选择合适的建树方法。a.序列有很高相似性时,选择最大简约法(MP)。b.序列较高的相似性时,选择距离法,包括邻接法(NJ)。c.序列相似性很低,选择最大似然法(ML)。(3)使用软件建树。a.选择MP法,使用PAUP、MEGA、或PHYLIP。b.选择NJ法,使用PHYLIP、MEGA、或ClustalX。c.选择ML法,使用PHYML或BioEdit。(4)用软件评估进化树。14.RNAi的原理。答:(1)外源进入生物体的双链RNA(dsRNA)被一种核糖核酸
11、酶Dicer所识别并将其切割成2123nt的小干扰RNA(siRNA)。(2)这种siRNA可以被RISC(RNA诱导的沉默复合物)所识别并结合,进而使siRNA发生解旋和解链。(3)然后再siRNA反义链的引导下,寻找与siRNA具有同源序列的内源靶mRNA。(4)RISC与内源靶mRNA同源区进行特异性结合,并切割靶mRNA,导致转录后基因沉默。(5)siRNA不仅能引导RISC切割靶mRNA,而且可作为引物与靶mRNA结合并以mRNA为模板,在RdRP(RNA依赖的RNA聚合酶)作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量次级siRNA,从而使RNAi的作用
12、放大,最终将所有靶mRNA降解,导致基因的完全沉默。15.RNAi载体构建过程。16.高效siRNA设计步骤。答:(1)靶基因鉴定(2)建立分析(3)序列过滤(4)序列翻译分析(5)获得序列(6)序列比对(7)选取序列(8)合成siRNA。17.给定miRNA序列,怎么研究其功能?答:(1)上调miRNA在细胞中的含量而获得gain-of-function模型,具体可以将miRNA的前体序列或成熟序列克隆到专门表达短片段RNA的特殊载体中。(2)下调miRNA在细胞中的含量或直接抑制该miRNA的功能获得loss-of-function模型。结合上调和下调结果可以确定基因的表达是否受到特定mi
13、RNA的调控。C论述题1.构建表达载体:融合表达载体GUS GFP,并说明用途。答:A. GUS基因编码-葡萄糖酸酶,能够催化底物产生荧光物质或者蓝色产物。可以利用GUS基因与目的基因融合表达来筛选转化子,也可用于外源基因表达产物在转化生物体中的定位分析。B.GFP基因编码绿色荧光蛋白,在紫外光照射下发出荧光。可以利用GFP基因和目的基因融合表达在荧光显微镜下观察目的基因编码蛋白的动态变化,筛选转化子,也可用于外源基因表达产物的定位分析。C构建步骤:(1)对目的基因cDNA和GUS,GFP进行限制性酶切分析,找出目的基因编码区,GUS基因编码区,GFP编码区中的酶切位点,排除这些酶切位点。(2
14、)选择合适的载体,如pET系列(原核)或者pCAMBIA 系列(植物)等,并找出被排除以外的酶切位点,选择3个酶切位点。(3)设计引物扩增目的基因,GUS基因,GFP基因,如果没有选择的酶切位点,则在引物中引入酶切位点。融合表达在前的基因终止密码子在设计引物时去掉,二个基因连接区要保证引物扩增的产物不会破坏ORF框架即起始密码子前扩增区段要保证为3联体密码。(4)先连接目的基因与GFP或者GUS,再将融合基因与载体连接。2.怎么样降低,升高基因的表达。答:A.降低基因表达:设计siRNA干涉该基因的表达。步骤:(1)选择欲干涉的靶基因的片段位置,并列出候选siRNA序列。(2)评估候选siRN
15、A序列,如SNP,形式功能,高级结构等。(3)进行BLAST比对,排除与非靶基因互补的候选siRNA序列。(4)从功能特异性角度出发,选择最终siRNA序列。(5)合成siRNA,包括化学合成,体外转录,构建表达载体等。(6)转入生物体内。(7)检测干涉情况。B.升高基因表达:将该基因转入含有病毒强启动子的载体中使基因超表达。(以植物为例)步骤:(1)选择超表达载体,即含有病毒强启动子的表达载体。(2)对目的基因进行限制性酶切分析,排除目的基因编码区具有的酶切位点,选择合适载体具有的酶切位点。(3)设计引物扩增目的基因,引入酶切位点。(4)将目的基因连接到超表达载体上。(5)转化,农杆菌转染(
16、植物)。(6)检测表达情况。3.PCR引物设计的原则?答:(1)引物长度。1530bp。(2)引物的特异性。引物应在核酸序列保守区内设计。(3)引物的碱基分布。引物4种碱基分布随机,3端避免出现3个以上连续的G或C。(4)引物的互补情况。避免引物二聚体和发夹结构的产生。(5)引物的修饰情况。引物5端加修饰,3端不能修饰。(6)产物的二级结构。引物设计避开DNA单链二级结构。(7)引物的GC含量。GC含量40%60%。(8)引物Tm值。Tm值72左右。(9)引物G值。引物3端G值较低,5、中间G值较高。(10)密码子的简并。3端不要终止在密码子的第三位。4.一个未知基因的DNA序列,设计分析这个序列的流程,以及方法,鉴定其功能,翻译出的氨基酸序列,鉴定出属于哪个家族。答:(1)使用DNAMAN,BioEdit统计基本指标。(2)使用Transeq,Translate Tool ,ORF Finder对该序列进行6个框架的翻译。(3)对6个ORF翻译序列或者核苷酸序列在数据库中进行序列比对(BLAST)(4)通过多序列比对查找基因家族5.未知氨基酸序列,设计分析步骤,鉴定属于哪个家族。6.含有5-UTR,3-UTR,EXON, INTRON的序列,手动设计引物,写出PCR体系,算出退火温度。专心-专注-专业