《2015年上半年-数据库系统工程师-答案详解(共48页).docx》由会员分享,可在线阅读,更多相关《2015年上半年-数据库系统工程师-答案详解(共48页).docx(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上机器字长为n位的二进制数可以用补码来表示(1)个不同的有符号定点小数。(1)A.2nB.2n-1C.2n-1D.2n-1+1【答案】A【解析】本题考查计算机系统基础常识。二进制数据在计算机系统中的表示方法是最基本的专业知识。补码本身是带符号位的,补码表示的数字中0是唯一的,不像原码有+0和-0之分,也就意味着位n二进制编码可以表示2n个不同的数。计算机中CPU对其访问速度最快的是(2)。 (2)A.内存B.CacheC.通用寄存器D.硬盘【答案】C【解析】本题考查计算机系统基础知识。计算机系统中的CPU内部对通用寄存器的存取操作枭速度最快的,其次是Cache,内存的存
2、取速度再次,选项中访问速度最慢的就是作为外存的硬盘。它们共同组成分级存储体系来解决存储容量、成本和速度之间的矛盾。Cache的地址映像方式中,发生块冲突次数最小的是(3)。 (3)A.全相联映像B.组相联映像C.直接映像D.无法确定的【答案】A【解析】本题考查计算机系统基础知识。Cache工作时,需要拷贝主存信息到Cache中,就需要建立主存地址和Cache地址的映射关系。Cache的地址映射方法主要有三种,即全相联影像、直接映像和组相联映像。其中全相联方式意味着主存的任意一块可以映像到Cache中的任意一块,其特点是块冲突概率低,Cache空间利用率高,但是相联目录表容量大导致成本高、查表速
3、度慢;直接映像方式是指主存的每一块只能映像到Cache的一个特定的块中,整个Cache地址与主存地址的低位部分完全相同,其特点是硬件简单,不需要相联存储器,访问速度快(无需地址变换),但是Cache块冲突概率高导致Cache空间利用率很低;组相联方式是对上述两种方式的折中处理,对Cache分组,实现组间直接映射,组内全相联,从而获得较低的块冲突概率、较高的块利用率,同时得到较快的速度和较低的成本。计算机中CPU的中断响应时间指的是(4)的时间。(4) A.从发出中断请求到中断处理结束B.从中断处理开始到中断处理结束 C.CPU分析判断中断请求D.从发出中断请求到开始进入中断处理程序【答案】D【
4、解析】本题考查计算机组成原理的基础知识。中断系统是计算机实现中断功能的软硬件总称。一般在CPL中设置中断机构,在外设接口中设置中断控制器,在软件上设置相应的中断服务程序。中断源在需要得到CPU服务时,请求CPU暂停现行工作转向为中断源服务,服务完成后,再让CPU回到原工作状态继续完成被打断的工作。中断的发生起始于中断源发出中断请求,中断处理过程中,中断系统需要解决一系列问题,包括中断响应的条件和时机,断点信息的保护与恢复,中断服务程序入口、中断处理等。中断响应时间,是指从发出中断请求到开始进入中断服务程序所需的时间。总线宽度为32bit,时钟频率为200MHz,若总线上每5个时钟周期传送一个3
5、2bit的字,则该总线的带宽为(5)MB/S。(5)A.40B.80C.160D.200【答案】C【解析】本题考查计算机系统的基础知识。总线宽度是指总线的位数,即数据信号的并行传输能力,也体现总线占用的物理空间和成本;总线的带宽是指总线的最大数据传输率,即每秒传输的数据总量。总线宽度与时钟频率共同决定了总线的带宽。32bit/8=4Byte,200MHz/54Byte=160MB/s以下关于指令流水线性能度量的描述中,错误的是(6)。(6) A.最大吞吐率取决于流水线中最慢一段所需的时间 B.如果流水线出现断流,加速比会明显下降 C.要使加速比和效率最大化应该对流水线各级采用相同的运行时间 D
6、.流水线采用异步控制会明显提高其性能【答案】D【解析】本题考查计算机系统结构基础知识。对指令流水线性能的度量主要有吞吐率、加速比和效率等指标。吞吐率是指单位时间内流水线所完成的任务数或输出结果的数量,最大吞吐率则是流水线在达到稳定状态后所得到的吞吐率,它取决于流水线中最慢一段所需的时间,所以该段成为流水线的瓶颈。流水线的加速比定义为等功能的非流水线执行时间与流水线执行时间之比,加速比与吞吐率成正比,如果流水线断流,实际吞吐率将会明显下降,则加速比也会明显下降。流水线的效率是指流水线的设备利用率,从时空图上看效率就是n个任务所占的时空区与m个段总的时空区之比。因此要使加速比和效率最大化应该对流水
7、线各级采用相同的运行时间。另外,流水线釆用异步控制并不会给流水线性能带来改善,反而会增加控制电路的复杂性。(7)协议在终端设备与远程站点之间建立安全连接。(7)A.ARPB.TelnetC.SSHD.WEP【答案】C【解析】终端设备与远程站点之间建立安全连接的协议是SSH。SSH为Secure Shell的缩写,是由IETF制定的建立在应用层和传输层基础上的安全协议。SSH是专为远程登录会话和其他网络服务提供安全性的协议。利用SSH协议可以有效防止远程管理过程中的信息泄露问题。SSH最初是UNIX上的程序,后来又迅速扩展到其他操作平台。安全需求可划分为物理线路安全、网络安全、系统安全和应用安全
8、。下面的安全需求中属于系统安全的是(8),属于应用安全的是(9)。(8)A.机房安全B.入侵检测C.漏洞补丁管理D.数据库安全(9)A.机房安全B.入侵检测C.漏洞补丁管理D.数据库安全【答案】C D【解析】 机房安全属于物理安全,入侵检测属于网络安全,漏洞补丁管理属于系统安全,而数据库安全则是应用安全。王某是某公司的软件设计师,每当软件开发完成后均按公司规定编写软件文档,并提交公司存档。那么该软件文档的著作权(10)享有。(10)A.应由公司B.应由公司和王某共同 C.应由王某D.除署名权以外,著作权的其他权利由王某【答案】A【解析】本题考查知识产权的基本知识。依据著作权法第十一条、第十六条
9、规定,职工为完成所在单位的工作任务而创作的作品属于职务作品。职务作品的著作权归属分为两种情况。虽是为完成工作任务而为,但非经法人或其他组织主持,不代表其意志创作,也不由其承担责任的职务作品,如教师编写的教材;著作权应由作者享有,但法人或者其他组织有权在其业务范围内优先使用的权利,期限为2年。由法人或者其他组织主持,代表法人或者其他组织意志创作,并由法人或者其他组织承担责任的职务作品,如工程设计、产品设计图纸及其说明、计算机软件、地图等职务作品,以及法律规定或合同约定著作权由法人或非法人单位单独享有的职务作品,作者享有署名权,其他权利由法人或者其他组织享有。甲、乙两公司的软件设计师分别完成了相同
10、的计算机程序发明,甲公司先于乙公司完成,乙公司先于甲公司使用。甲、乙公司于同一天向专利局申请发明专利。此情形下,(11)可获得专利权。(11)A.甲公司 B.甲、乙公司均C.乙公司 D.由甲、乙公司协商确定谁【答案】D【解析】本题考查知识产权的基本知识。当两个以上的申请人分别就同样的发明创造申请专利的专利权授给最先申请的人。如果两个以上申请人在同一日分别就同样的发明创造申请专利的,应当在收到专利行政管理部门的通知后自行协商确定申请人。如果协商不成,专利局将驳回所有申请人的申请,即均不授予专利权。我国专利法规定:“两个以上的申请人分别就同样的发明创造申请专利的,专利权授予最先申请的人”。我国专利
11、法实施细则规定:“同样的发明创造只能被授予一项专利。依照专利法第九条的规定,两个以上的申请人在同一日分别就同样的发明创造申请专利的,应当在收到国务院专利行政部门的通知后自行协商确定申请人”。以下媒体中,(12)是感觉媒体。(12)A.音箱B.声音编码C.电缆D.声音【答案】D【解析】本题考查多媒体基本知识。感觉媒体指直接作用于人的感觉器官,使人产生直接感觉的媒体,如引起听觉反应的声音,引起视觉反应的图像等。微型计算机系统中,显示器属于(13)。 (13)A.表现媒体B.传输媒体C.表示媒体D.存储媒体【答案】A【解析】本题考查多媒体基本知识。表现媒体是指进行信息输入和输出的媒体,如键盘、鼠标、
12、话筒,以及显示器、打印机、喇叭等;表示媒体指传输感觉媒体的中介媒体,即用于数据交换的编码,如图像编码、文本编码和声音编码等;传输媒体指传输表示媒体的物理介质,如电缆、光缆、电磁波等;存储媒体指用于存储表示媒体的物理介质,如硬盘、光盘等。(14)是表示显示器在纵向(列)上具有的像素点数目指标。(14)A.显示分辨率B.水平分辨率C.垂直分辨率D.显示深度【答案】C【解析】本题考查多媒体基本知识。显示分辨率是指显示器上能够显示出的像素点数目,即显示器在横向和纵向上能够显示出的像素点数目。水平分辨率表明显示器水平方向(横向)上显示出的像素点数目,垂直分辨率表明显示器垂直方向(纵向)上显示出的像素点数
13、目。例如,显示分辨率为1024X768则表明显示器水平方向上显示1024个像素点,垂直方向上显示768个像素点,整个显示屏就含有个像素点。屏幕能够显示的像素越多,说明显示设备的分辨率越髙,显示的图像质量越高。显示深度是指显示器上显示每个像素点颜色的二进制位数。软件工程的基本要素包括方法、工具和(15)。 (15)A.软件系统B.硬件系统C.过程D.人员【答案】C【解析】本题考査软件工程的基本概念。软件工程是一门工程学科,涉及到软件开发的各个方面,从最初的系统描述到交付后的系统维护,都属于其学科范畴。用软件工程方法进行软件开发,涉及到方法、工具和过程等要素。其中,方法是产生某些结果的形式化过程。
14、工具是用更好的方式完成某件事情的设备或自动化系统。过程是把工具和方法结合起来,定义涉及活动、约束和资源使用的一系列步骤,来生产某种想要的输出。在(16)设计阶段选择适当的解决方案,将系统分解为若干个子系统,建立整个系统的体系结构。(16)A.概要B.详细C.结构化D.面向对象【答案】A【解析】本题考查软件工程的基本概念。软件设计的任务是基于需求分析的结果建立各种设计模型,给出问题的解决方案。从工程管理的角度,可以将软件设计分为两个阶段:概要设计阶段和详细设计阶段。结构化设计方法中,概要设计阶段进行软件体系结构的设计、数据设计和接口设计;详细设计阶段进行数据结构和算法的设计。面向对象设计方法中,
15、概要设计阶段进行体系结构设计、初步的类设计/数据设计、结构设计;详细设计阶段进行构件设计。结构化设计和面向对象设计是两种不同的设计方法,结构化设计根据系统的数据流图进行设计,模块体现为函数、过程及子程序;面向对象设计基于面向对象的基本概念进行,模块体现为类、对象和构件等。某项目包含的活动如下表所示,完成整个项目的最短时间为(17)周。不能通过缩短活动(18)的工期,来缩短整个项目的完成时间。(17)A.16B.17C.18D.19(18)A.AB.BC.DD.F【答案】D B【解析】本题考査软件项目管理的基础知识。活动图是描述一个项目中各个工作任务相互依赖关系的一种模型,项目的很多重要特性可以
16、通过分析活动图得到,如估算项目完成时间,计算关键路径和关键活动等。根据上表给出的数据,构建活动图,如下图所示。从上图很容易看出,关键路径为A-D-E-F-H,其长度为19,关键路径上的活动均为关键活动。风险的优先级通常是根据(19)设定。 (19)A.风险影响(Risk Impact)B.风险概率(Risk Probability) C.风险暴露(Risk Exposure)D.风险控制(Risk Control)【答案】C【解析】本题考查软件项目管理的基础知识。风险是一种具有负面后果的、人们不希望发生的事件。风险管理是软件项目管理的一项重要任务。在进行风险管理时,根据风险的优先级来确定风险控
17、制策略,而优先级是根据风险暴露来确定的。风险暴露是一种量化风险影响的指标,等于风险影响乘以风险概率。风险影响是当风险发生时造成的损失。风险概率是风险发生的可能性。风险控制是风险管理的一个重要活动。以下关于程序设计语言的叙述中,错误的是(20)。(20)A.程序设计语言的基本成分包括数据、运算、控制和传输等 B.高级程序设计语言不依赖于具体的机器硬件 C.程序中局部变量的值在运行时不能改变 D.程序中常量的值在运行时不能改变【答案】C【解析】本题考查程序语言基础知识。选项A涉及程序语言的一般概念,程序设计语言的基本成分包括数据、运算、控制和传输等。选项B考查高级语言和低级语言的概念。关于程序设计
18、语言,高级语言和低级语言是指其相对于运行程序的机器的抽象程度。低级语言在形式上越接近机器指令,汇编语言就是与机器指令一一对应的。高级语言对底层操作进行了抽象和封装,其一条语句对应多条机器指令,使编写程序的过程更符合人类的思维习惯,并且极大了简化了人力劳动。高级语言并不依赖于具体的机器硬件。选项C考查局部变量的概念,凡是在函数内部定义的变量都是局部变量(也称作内部变量),包括在函数内部复合语句中定义的变量和函数形参表中说明的形式参数。局部变量只能在函数内部使用,其作用域是从定义位置起至函数体或复合语句体结束为止。局部变量的值通常在其生存期内是变化的。选项D考查常量的概念,程序中常量的值在运行时是
19、不能改变的。与算术表达式“(a+(b-c)*d”对应的树是(21)。 (21)A.B.C.D.【答案】B【解析】本题考查程序语言与数据结构基础知识。对算术表达式“(a+(b-c)*d”求值的运算处理顺序是:先进行b-c,然后与a相加,最后再与d相乘。只有选项B所示的二叉树与其相符。程序中全局变量的存储空间在(22)分配。(22)A.代码区B.静态数据区C.栈区D.堆区【答案】B【解析】本题考查程序语言基础知识。程序运行时的用户内存空间一般划分为代码区、静态数据区、栈区和堆区,其中栈区和堆区也称为动态数据区。全局变量的存储空间在静态数据区。进程P1、P2、P3、P4和P5的前趋图如下所示:若用P
20、V操作控制进程P1、P2、P3、P4和P5并发执行的过程,则需要设置5个信号量S1、S2、S3、S4和S5,且信号量S1S5的初值都等于零。下图中a、b和c处应分别填写(23);d和e处应分别填写(24),f和g处应分别填写(25)。 (23)A.V(S1)、P(S1)和V(S2)V(S3)B.P(S1)、V(S1)和V(S2)V(S3) C.V(S1)、V(S2)和P(S1)V(S3)D.P(S1)、V(S2)和V(S1)V(S3)(24)A.V(S2)和P(S4)B.P(S2)和V(S4) C.P(S2)和P(S4)D.V(S2)和V(S4) (25)A.P(S3)和V(S4)V(S5)B
21、.V(S3)和P(S4)和P(S5) C.P(S3)和P(S4)P(S5)D.V(S3)和V(S4)和V(S5)【答案】A B C【解析】试题(23)的正确的选项为A。根据前驱图,P1进程执行完需要通知P2进程,故需要利用V(S1)操作通知P2进程,所以空a应填V(S1);P2进程需要等待P1进程的结果,故需要利用P(S1)操作测试P1进程是否运行完,所以空b应填P(S1);又由于P2进程运行结束需要利用V(S2)、V(S3)操作分别通知P3、P4进程,所以空c应填V(S2)、V(S3)。试题(24)的正确的答案为B。根据前驱图,P3进程运行前需要等待P2进程的结果,故需执行程序前要先利用1个
22、P操作,根据排除法可选项只有选项B和选项C。又因为P3进程运行结束后需要利用1个V操作通知P5进程,根据排除法可选项只有选项B满足要求。试题(25)的正确的答案为C。根据前驱图,P4进程执行前需要等待P2进程的结果,故空f处需要1个P操作;P5进程执行前需要等待P3和P4进程的结果,故空g处需要2个P操作。根据排除法可选项只有选项C能满足要求。某进程有4个页面,页号为03,页面变换表及状态位、访问位和修改位的含义如下图所示。若系统给该进程分配了3个存储块,当访问的页面1不在内存时,淘汰表中页号为(26)的页面代价最小。 (26)A.0B.1C.2D.3【答案】D【解析】试题(26)的正确选项为
23、D。根据题意,页面变换表中状态位等于0和1分别表示页面不在内存或在内存,所以0、2和3号页面在内存。当访问的页面1不在内存时,系统应该首先淘汰未被访问的页面,因为根据程序的局部性原理,最近未被访问的页面下次被访问的概率更小;如果页面最近都被访问过,应该先淘汰未修改过的页面。因为未修改过的页面内存与辅存一致,故淘汰时无须写回辅存,使系统页面置换代价小。经上述分析,0、2和3号页面都是最近被访问过的,但0和2号页面都被修改过而3号页面未修改过,故应该淘汰3号页面。某公司计划开发一个产品,技术含量很高,与客户相关的风险也很多,则最适于采用(27)开发过程模型。(27)A.瀑布B.原型C.增量D.螺旋
24、【答案】D【解析】本题考查软件过程模型的基础知识。瀑布模型将软件生存周期各个活动规定为线性顺序连接的若干阶段的模型,规定了由前至后,相互衔接的固定次序,如同瀑布流水,逐级下落。这种方法是一种理想的现象开发模式,缺乏灵活性,特别是无法解决软件需求不明确或不准确的问题。原型模型从初始的原型逐步演化成最终软件产品,特别适用于对软件需求缺乏准确认识的情况。增量开发是把软件产品作为一系列的增量构件来设计、编码、集成和测试,可以在增量开发过程中逐步理解需求。螺旋将瀑布模型与快速原型模型结合起来,并且加入两种模型均忽略了的风险分析,适用于复杂的大型软件。数据流图(DFD)的作用是(28)。(28)A.描述数
25、据对象之间的关系B.描述对数据的处理流程 C.说明将要出现的逻辑判定D.指明系统对外部事件的反应【答案】B【解析】本题考查数据流图的概念和应用。数据流图或称数据流程图(Data Flow Diagram,DFD)是一种便于用户理解、分析系统数据流程的图形工具。数据流图描述对数据的处理流程,着重系统信息的流向和处理过程。它摆脱了系统的物理内容,精确地在逻辑上描述系统的功能、输入、输出和数据存储等,是系统逻辑模型的重要组成部分。若关系R(H,L,M,P)的主键为全码(All-key),则关系R的主键应(29)。 (29)A.为HLMPB.在集合H,L,M,P中任选一个 C.在集合HL,HM,HP,
26、LM,LP,MP中任选一个 D.在集合HLM,HLP,HMP,LMP)中任选一个【答案】A【解析】本题考查关系数据库系统中键的基本概念。在关系数据库系统中,全码(All-key)指关系模型的所有属性组是这个关系模式的候选键,本题所有属性组为HLMP,故本题的正确选项为A。在关系R(A1,A2,A3)和S(A2,A3,A4)上进行关系运算的4个等价的表达式E1,E2,E3和E4如下所示:如果严格按照表达式运算顺序,则查询效率最高的是(30)。将该查询转换为等价的SQL语句如下:SELECT A1,A4 FROM R ,SWHERE(31) (30)A.E1B.E2C.E3D.E4(31)A.R.
27、A2 2015 0R S.A4=95B.R.A2 2015 AND S.A4=95 C.R.A2 2015 0R S.A4=95 0R R.A2=S.A2D.R.A2 2015 AND S.A4=95 AND R.A3=S.A3【答案】B D【解析】本题考查关系代数表达式的等价性问题和查询优化方面的基本知识。试题(30)正确的选项为B。表达式E2的查询效率最高,因为E2将选取运算A22015(R)和A4=80(S)移到了叶节点,然后进行自然连接运算。这样满足条件的元组数比先进行笛卡儿积产生的元组数大大下降,甚至无需中间文件,就可将中间结果放在内存,最后在内存即可形成所需结果集。试题(31)正确
28、的选项为D。在关系片R(A1,A2,A3)和S(A2,A3,A3)上进行关系运算的4个等价的表达式中可以看出,E3=A1,A4(A22015R.A3=S.A3A4=95(RS))应该先进行RS运算,然后在结果集中进行满足条件“R.A22015S.A495R.A3=S.A3”的选取运算,最后再进行属性A1A4的投影运算。可见,选项D与条件“R.A22015S.A495R.A3=S.A3”等价。部门、员工和项目的关系模式及它们之间的E-R图如下所示,其中,关系模式中带实下划线的属性表示主键属性。部门(部门代码,部门名称,电话)员工(员工代码,姓名,部门代码,联系方式,薪资)项目(项目编号,项目名称
29、,承担任务)若部门和员工关系进行自然连接运算,其结果集为(32)元关系。由于员工和项目关系之间的联系类型为(33),所以员工和项目之间的联系需要转换成一个独立的关系模式,该关系模式的主键是(34)。(32)A.5B.6C.7D.8(33)A.1对1B.1对多C.多对1D.多对多 (34)A.(项目名称,员工代码)B.(项目编号,员工代码) C.项目名称,部门代码)D.(项目名称,承担任务)【答案】C D B【解析】本题考查关系数据库E-R模型的相关知识。试题(32)的正确答案是C。根据题意,部门和员工关系进行自然连接运算,应该去掉一个重复属性“部门代码”,所以自然连接运算的结果集为7元关系。试
30、题(33)的正确答案是D。在E-R模型中,用1 1表示1对1联系,用1 *表示1对多联系,用* *表示多对多联系。试题(34)的正确答案是B。因为员工和项目之间是一个多对多的联系,多对多联系的向关系模式转换的规则是:多对多联系只能转换成一个独立的关系模式,关系模式的名称取联系的名称,关系模式的属性取该联系所关联的两个多方实体的主键及联系的属性,关系的码是多方实体的主键构成的属性组。由于员工关系的主键是员工代码,项目关系的主键是项目编号,因此,根据该转换规则试题(34)员工和项目之间的联系的关系模式的主键是(员工代码,项目编号)。给定关系模式R(A1,A2,A3,A4),R上的函数依赖集F= A
31、1A3A2,A2A3,R(35)。若将R分解为p=(A1,A2,A4),(A1,A3)那么该分解是(36)的。(35)A.有一个候选关键字A1A3B.有一个候选关键字A1A2A3 C.有二个候选关键字A1A3A4和A1A2A4D.有三个候选关键字A1A2,A1A3和A1A4(36)A.无损联接B.无损联接且保持函数依赖 C.保持函数依赖D.有损联接且不保持函数依赖【答案】C D【解析】本题考查关系数据库规范化理论方面的基础知识。试题(35)正确答案为C,因为A1A3A2,A2A2,没有出现A4,所以候选关键字中肯定包含A4,属性冯A1A3A4决定全属性,故为候选关键字。同理A1A3A4也为候选
32、关键字。试题(36)正确答案为D。设U1=A1,A2,A4,U2=A1,A3,那么可得出:(U1U2)(U1-U2)=A1A2,(U1U2)(U1-U2)=A1A3,而A1A2,A1A3F+所以分解是有损连接的。又因为F1=F2=,F+(F1F2)+,所以分解不保持函数依赖。关系R、S如下表所示,的结果为(37),R、S的左外连接、右外连接和完全外连接的元组个数分别为(38) (37)A.4B.3,4C.3,4,7D.(1,2), (2,1), (3,4), (4,7)(38)A.2,2,4B.2,2,6C.4,4,4D.4,4,6【答案】A D【解析】本题考查关系代数运算方面的知识。试题(3
33、7)的正确结果为A,因为关系代数的除法运算是同时从关系的水平方向和垂直方向进行运算的。若给定关系R(X,Y)和S(Y,Z),X、Y和Z为属性组,RS满足元组在X上的分量值x的象集Yx包含S在Y上投影的集合。记作:RS=tr|trRtsYYX其中Yx为x在A3的象集,x=trX 且RS的结果集的属性组为X。根据除法定义,试题X属性为A3,y属性为(A1,A2),RS应当满足元组在X上的分量值x的象集包含S在Y上投影的集合,所以结果集的属性为A3。属性A3可以取3个值3,4,7,其中:3的象集为(1,2),4的象集为(2,1),(3,4),7的象集为(4,6)。根据除法定义,本题关系S为A1,A2
34、(13(S),在属性组YA1,A3上的投影为(2,1),(3,4)如下表所示:从上述分析可以看出,只有关系R的属性A3的值为4时,其象集包含了关系S在属性组X即(A1,A2)上的投影,所以RS=4。试题(38)的正确结果为D。两个关系R和S进行自然连接时,选择两个关系R和S公共属性上相等的元组,去掉重复的属性列构成新关系。在这种情况下,关系R中的某些元组有可能在关系S中不存在公共属性值上相等的元组,造成关系R中这些元组的值在运算时舍弃了;同样关系S中的某些元组也可能舍弃。为此,扩充了关系运算左外联接、右外联接和完全外联接。左外联接是指与R与S进行自然连接时,只把R中舍弃的元组放到新关系中。右外
35、联接是指R与S进行自然连接时,只把S中舍弃的元组放到新关系中。完全外联接是指R与S进行自然连接时,把R和S中舍弃的元组都放到新关系中。试题(38)R与S的左外联接、右外联接和完全外联接的结果如下表所示:从运算的结果可以看出R与S的左外联接、右外联接和完全外联接的元组个数分别为4,4,6。数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。(39)A.关联分析B.序列模式分析C.分类分析D.聚类分析【答案】C【解析】本题考查数据挖掘基础知识。数据挖掘就是应用一系列技术从大型数据
36、库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种即关联分析、序列模式分析、分类分析和聚类分析。关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R=A1,A2,.,AP为0,1域上的属性集,r为R上的一个关系,关于r的关联规则表示为XB,其中XR,BR,且XB=。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需
37、要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。序列模式分析(Sequential Patterns):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检
38、查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。聚类分析(Clustering):聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。在实际应用的DM系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。某医院住院部信息系统中有病人表R(住院号,姓名,性别,科室号,病房,家庭住址),“住院号”唯一标识表R中的每一个元组,“性别”的取值只能为M或F,“家庭住址”包括省、市、街道、邮编,要求科室号参照科室关
39、系D中的科室号;科室关系D(科室号,科室名,负责人,联系电话),“科室号”唯一标识关系D中的每一个元组。a创建关系R的SQL语句如下:CREATE TABLE R(住院号CHAR(8) (40),姓名CHAR(10),性别CHAR(1) (41),科室号CHAR(4),病房CHAR(4),家庭住址ADDR, /ADDR为用户定义的类(42) );b表R中复合属性是(43)。(40)A.PRIMARY KEYB.REFERENCES D(科室号) C.NOT NULLD.REFERENCES D(科室名)(41)A.IN (M,F)B.CHECK(M,F) C.LIKE(M,F)D.CHECK(
40、性别 IN(M,F)(42)A.PRIMARY KEY(科室号)NOT NULL UNIQUE B.PRIMARY KEY(科室名)UNIQUE C.FOREIGN KEY(科室号)REFERENCES D(科室号) D.FOREIGN KEY(科室号)REFERENCES D(科室名)(43)A.住院号B.姓名C.病房D.家庭住址【答案】A D C D【解析】试题(40)的正确答案是A。根据题意,属性“住院号”唯-标识关系R中的每一个元组,因此需要用语句“PRIMARY KEY”进行主键的完整性约束。试题(41)的正确答案是D。根据题意,属性“性别”的取值只能为M或F,因此需要用语句“CHE
41、CK(性别IN(M,F)”进行完整性约束。试题(42)的正确答案是C。根据题意。属性“科室号”是外键,因此需要用语句“REFERENCESD(科室号)”进行参考完整性约束。试题(43)的正确答案是D。简单属性是原子的、不可再分的,复合属性可以细分为更小的部分(即划分为别的属性)。试题中“家庭住址”属性可以进一步分为邮编、省、市、街道,故属于复合属性。数据字典中“数据项”的内容包括:名称、编号、取值范围、长度和(44)。(44)A.处理频率B.最大记录数C.数据类型D.数据流量【答案】C【解析】本题考查数据库的基础知识。数据字典(Data Dictionary,DD)是各类数据描述的集合,它是关
42、于数据库中数据的描述,即元数据,而不是数据本身。如用户将向数据库中输入什么信息,从数据库中要得到什么信息,各类信息的内容和结构,信息之间的联系等。数据字典包括数据项、数据结构、数据流、数据存储和处理过程5个部分(至少应该包含每个字段的数据类型和在每个表内的主键、外键)。其中“数据项”通常包括数据项名,数据项含义说明、别名、数据类型、长度、取值范围、取值含义、与其他数据项的逻辑关系。假设系统中只有事务T1和T2,两个事务都要对数据D1和D2进行操作。若T1对D1已加排它锁,T1对D2已加共享锁;那么T2对D1(45),那么T2对D2(46)。(45)A.加共享锁成功,加排它锁失败B.加共享锁、加
43、排它锁都失败 C.加共享锁、加排它锁都成功D.加排它锁成功,加共享锁失败(46)A.加共享锁成功,加排它锁失败B.加共享锁、加排它锁都失败 C.加共享锁、加排它锁都成功D.加排它锁成功,加共享锁失败【答案】B A【解析】本题考查数据库事务处理方面的基础知识。并发事务如果对数据读写时不加以控制,会破坏事务的隔离性和一致性。控制的手段就是加锁,在事务执行时限制其他事务对数据的读取。在并发控制中引入两种锁:排它锁(Exclusive Locks,简称X锁)和共享锁(Share Locks,简称S锁)。排它锁又称为写锁,用于对数据进行写操作时进行锁定。如果事务T对数据A加上X锁后,就只允许事务T读取和
44、修改数据A,其他事务对数据A不能再加任何锁,从而也不能读取和修改数据A,直到事务T释放A上的锁。共享锁又称为读锁,用于对数据进行读操作时进行锁定。如果事务T对数据A加上了S锁后,事务T就只能读数据A但不可以修改,其他事务可以再对数据A加S锁来读取,只要数据A上有S锁,任何事务都只能再对其加S锁读取而不能加X锁修改。层次模型和网状模型等非关系模型中,结点用来存储记录,记录间的联系用指针来表达;而关系模型中记录间的联系用(47)来描述,查找相关联记录需要进行记录遍历,为提高查找效率,可以建立(48)。(47)A.主码 B.关系C.数据模型D.概念模型(48)A.索引 B.触发器C.存储过程D.函数
45、【答案】B A【解析】本题考查数据模型的基础知识。概念模型是信息的描述方式,逻辑模型是数据的逻辑结构,数据模型是指数据的物理组织方式。逻辑模型(E-R图)中的联系描述的是实体间的关联关系,主要是现实世界中的事件,包括参与者和事件自身的属性。在关系模型中,取参与联系的实体的码(唯一代表具体的参与者)和事件自身的属性,构成记录即以关系的形式来描述。索引是为提高查询效率而引入的机制。通过对查询项建立索引表(包含查找项和指针,其中査找项进行排序或散列),可以通过查询条件先在索引表中进行查找(因为查找项有序,效率高),再根据指针项准确定位记录所在的页面进行读取,而无须进行大量的I/O操作读取所有记录。在数据库应用系统的体系结构中,常用的是C/S(客户机/服务器)结构和B/S(浏览器/服务器)结构。无论哪种结构,服务器都由(49)负责数据库的运行和维护。在C/S结构中,应用程序安装运行在(50)端,负责用户与数据库的交互;在B/S结构中,应用程序安装运行在(51)端,负责构建用户界面与数据库的交互,客户端使用浏览器展示用户界面并获取用户输入