《2022年《数据库系统概论》知识点总结.docx》由会员分享,可在线阅读,更多相关《2022年《数据库系统概论》知识点总结.docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学习必备欢迎下载一、挑选题:1. 在关系数据库的结构化查询语言中,“DELETE FROM表名”表示(从基表中删除全部属性);2. 在数据库治理系统中,事务的四个特性包括(原子性,一样性,隔离性,连续性);3. 在数据库理论中,用二维表结构表示的数据模型称为(关系模型);4. 在数据库系统结构中,用户使用的数据视图称为(外模式,也称子模式或用户模式);5. 以下说法正确选项( B);A. 数据库防止了一切数据冗余B. 数据库中的数据可以共享C.数据库防止了一切数据的重复D. 数据库具有完全的数据独立性6. 在关系数据库中,用于关系代的关系运算包括(挑选,投影,连接,除运算);7. 封锁机制主要
2、用于实现(并发掌握);8. 转储的冗余包括(日志文件、数据库后背副本)9. 在局部视图设计中,分E-R 图之间的冲突包含以下哪一个(A);A. 属性冲突 B. 实体冲突 C. 联系冲突 D. 关系冲突10. 关系演算是用(谓词)来表达查询要求的方式;11. 并发掌握:把关系数据库从错误状态复原到一样状态;12. 转储方式可分为(海量转储和增量转储);13. 在关系数据库的结构化查询语言中,实现分组查询的子句是(GROUP B)Y ;14. 在关系数据库的结构化查询语言中,带有“ EXISTS”谓词的子查询返回是 (规律值真“true ” 假“ false ”);15. 在关系数据库的结构化查询
3、语言中,实现“投影”操作的语句是(SELECT); 16.SQL 语言供应的功能不包括(A);A. 修改表结构 B. 删除属性列 C. 删除元组 D. 授权17. 两个函数依靠集 F 和 G等价的充分必要条件是(F*=G*);18. 下面列出的关于“视图”的条目中,不正确选项(C)A. 视图是外模式 B. 视图是虚表 C. 加快查询语句的执行速度D. 简化查询语句的编写19. 事务定义不正确的说法是(C)A. 用户定义的一个数据库操作序列B. 一个不行分割的工作单位C.就是程序 D 一条或一组SQL语句、或整个程序20. 关于函数依靠,正确选项(A)A. 如 X Y, Y Z,就 X YZ B
4、. 如 XYZ, 就 XZ,Y ZC.如 X Y, Y Z,就 Y X D. 如 X Y,Y Z, Y包含 Y,就 Z Y 二、填空题:1. 数据库系统死锁属于(事务故障);2. 在数据库设计中,(需求分析)表达了数据和处理的关系;3. 在数据库设计中, (数据字典)是系统中各类数据表述的集合,是进行具体的数据收集和数据分析所获得的主要成果;4. 事务是数据库的规律工作单位,包括的操作要么都要做,要么都不做,成为事务的(原子性);5. 在并发操作中,产生数据不一样性的主要缘由是并发操作破坏了事务的(一样性);6. (一样性)是指数据库中只包含胜利事务提交的结果;7. 对并发执行而言, 一个事务
5、的执行不能被其他事务干扰,一个事务内部的操作及使用的数据对其他并发事务是隔离的, 并发执行的各个事务之间不能相互干扰,成为事务的(隔离性);8. ( E R)模型是关系数据库的概念结构设计的一个有力工具;9. 关系数据库的(规范化理论)是使数据库设计方法走向完备的理论基础;10. (数据库治理系统)是治理数据库的机构,是位于用户与操作系统之间的一层数据治理软件;四设计题:某医院病房运算机治理中需要如下信息: 科室:科名、科地址、科电话、医生姓名; 病房:病房号、床位号、所属科室名;医生:姓名、职称、所属科室名、年龄、工作证号;病人:病历号、姓名、性别、诊断、主管医生、病房号;其中, 一个科室有
6、多个病房,多个医生;一个病房只能属于一个科室,一个医生只属于一个 科室, 但可以负责多个病人的诊治,一个病人的主管医生只有一个;完成如下设计: 设计该运算机治理系统的E R 图; 将该 E R 图转换为关系模型图; 指出转换结果中每个关系模式的候选码; 答:画图;科室:科名、科地址、科电话、医生姓名;病房:病房号、床位号、所属科室名;医生:姓名、职称、所属科室名、年龄、工作证号; 病人:病历号、姓名、性别、诊断、主管医生、病房号 科室关系模式的候选码(组)为:科地址或科名;病房关系模式的候选码为:病房号; 医生关系模式的候选码为:工作证号; 病人关系模式的候选码为:病历号;注:候选码为关系中的
7、某一属性组的值能唯独的标识一个元组; 课本内容整理:1.2.3.4.5. 描述事物的符号记录称为数据;数据库:长期储存在运算机内,有组织, 可共享的大量数据集合; 数据三个基本特点:永久储存、有组织、可共享;数据库治理系统:位于用户与操作系统之间的一层数据治理软件;DBMS功能: a. 数据定义 b. 数据组织储存和治理c. 数据操纵 d. 数据事务治理和运行治理e. 数据的建立和爱护f.其他功能;6. 数据库系统由数据库、数据库治理系统、应用系统、数据库治理员构成;7. 数据治理是指对数据进行分类、组织、编码、储存检索和爱护,他是数据处理的中心问题;8. 数据库系统的特点: a. 数据结构化
8、 b. 数据共享型高,冗余度低,易扩充c. 数据独立性高;9. 数据模型是数据库系统的核心和基础;10. 数据模型的组成要素:a. 数据结构 b. 数据操作 c. 数据的完整性约束;11. 实体:客观存在并可以相互区分的事物称为实体; 属性:实体具有的某一特性;码:唯独标识实体的属性集;实体型:用实体名及其属性名集合来抽象和刻化同类实体称为实体型;12. 元组:表中的一行称为一个元组; 重量:元组中的一个属性值;关系模式:对关系的描述,一般表示为关系名(属性1属性 n);13. 关系模型完整性:a. 实体完整性 b. 参照完整性 c. 用户定义完整性;14. 模式是数据库中全体数据的规律结构和
9、特点描述;15. 三级模式: a. 模式 b. 外模式 c. 内模式 ; 模式也称规律模式, 外模式也称子模式或用户模式,内模式也称储存模式, 一个数据库只有一个模式、 一个内模式, 可以有多个外模式;16. 二级映像:外模式模式映像模式内模式映像;17. 二级映像保证数据较高的规律独立性和物理独立性;18. 如关系中的某一个属性的值能唯独标识一个元组,该属性组称为候选码,候选码的诸属性称为主属性;19. 实体完整性:主属性不能为空;20. 运算的三大要素:运算对象、运算符、运算结果;21. 传统集合运算: a. 并 b. 差 c. 交 d. 笛卡尔积;22. 特地的关系运算:a. 挑选 b.
10、 投影 c. 连接 d. 除;23. 视图是导出表的虚表;24. SQL 集数据查询、数据操纵、数据定义、数据掌握于一身;25. SQL特点:a. 综合统一 b. 高度非过程化 c. 面对集合操纵 d. 同一种语法多种使用方法e.语言简洁易学易用;26. 数据查询 SELECT;数据定义 CREATE DROP ALTE;R数据操纵 INSERT UPDATE DELETE;数据掌握 GRANT REVOK;E27. SQL中,一个关系对应一个基本表,一个(或多个)基本表对应一个储存文件,一个表可以有如干索引,索引也可以存放在储存文件中;28. SQL 通常不供应修改模式定义、修改视图定义和修
11、改索引定义;29. 函数依靠会导致数据冗余、插入反常、删除反常和更新反常;30. Z Y 但 Y.X, 就称 X Y 是非平凡的函数依靠; X Y 但 YX,成 X Y 是平凡的函数依靠;如 X Y, Y X,就记 X Y;在 RU 中,假如 XY,并且对于 X 的任何一个真子集X,都有 X不 Y,就称 Y 对FX完全函数依靠,记X.Y;如 X Y 但 Y 不完全函数依靠于X,成 Y 对 X 部分函数依靠;31. 第一范式:假如一个关系模式的全部属性都是不行分割的基本数据项2NF:如 R.1NF且每个非主属性完全函数依靠于码;3NF:关系模式 R中如不存在这样的码X,属性组 Y 及非主属性 Z
12、,使得 X Y, YZ 成立, Y 不 X,称 R.3NF;BCNF:关系模式 R.1NF,如 X Y 且 Y.X时, X 必需含有码,就 R.BCNF;32. 数据库设计的过程和基本步骤:1. 需求分析; 2. 概念设计; 3. 规律设计; 4. 物理设计;5. 数据库实施阶段; 6. 数据库运行和爱护; 33数据字典是系统中各类数据表述的集合,是数据收集和分析的结果; 数据字典包括数据项、数据结构、数据流、数据储备和处理;34. 合并 E-R 图,生成初步 E-R: 1. 属性冲突、 2. 命名冲突、 3. 结构冲突35. 事务:用户定义的一个数据库操作序列,这些操作要么都要做,要么都不做
13、,是一个不行分割的工作单位;事务的四个特性:原子性、一样性、隔离性、连续性;36. 故障种类: 1. 事务内部、 2. 系统故障、 3. 介质故障、 4. 运算机病毒;37. 数据转储是数据库复原中采纳的基本技术;转储分为静态转储和动态转储,也可分为海量转储和增量转储;38. 日志文件是用来记录事务对数据库的更新操作的文件;39. 视图的作用: a. 能简化用户操作(简化用户的数据查询操作);b. 能以多种角度看待同一种数据; c. 对重构数据供应了肯定程度的规律独立性;d. 能够对秘密数据供应安全爱护;e. 适当的利用视图可以更清楚的表达查询;数据的物理独立性:用户的应用程序不依靠数据库的物
14、理结构;数据的规律独立性: 当数据库重构时, 如增加新的关系或对原有关系增加新的字段等,用户的应用程序不会受影响;学习必备欢迎下载12345其次篇:数据结构学问点整理5100 字数据是信息的载体, 是描述客观事物的数、字符、以及全部能输入到运算机中,被运算机程序识别和处理的符号(数值、字符等)的集合;数据元素(数据成员) 是数据的基本单位; 在不同的条件下, 数据元素又可称为元素、结点、顶点、记录等数据对象具有相同性质的数据元素(数据成员)的集合数据结构由某一数据对象及该对象中全部数据成员之间的关系组成;记为 Data_Structure=D, R其中, D 是某一数据对象,R 是该对象中全部
15、数据成员之间的关系的有限集合;数据类型是指一种类型,以及定义在这个值集合上的一组操作的总称;判定一个算法的优劣主要标准:正确性、可使用性、可读性、效率、健壮性、简洁性;算法效率的衡量方法:后期测试,事前估量算法分析是算法的渐进分析简称数据结构包括“规律结构”和“物理结构”两个方面 层次 :规律结构是对数据成员之间的规律关系的描述,它可以用一个数据成员的集合和定义在此集合上的如干关系来表示物理结构是规律结构在运算机中的表示和实现,故又称“储备结构”线性表的定义: n( . 0 )个表项的有限序列L=( a1, a2, ,an) ai是表项, n 是表长度;第一个表项是表头,最终一个是表尾;线性表
16、的特点: 表中元素的数据类型相同;线性表中,结点和结点间的关系是一对一的,有序表和无序表线性表的储备方式;一,次序储备方式,二,链表储备方式;次序表的储备表示有2 种方式:静态方式和动态方式;次序表的定义是: 把线性表中的全部表项根据其规律次序依次储备到从运算机储备中指定储备位置开头的一块连续的储备空间中;次序表的特点: 用地址连续的一块储备空间次序存放各表项,各表项的规律次序与物理次序一样,对各个表项可以次序拜访,也可以随机拜访;单链表是一种最简洁的链表表示,也叫线性链表, 用她来表示线性表时, 用指针表示结点间的规律关系;特点:是长度可以很便利地进行扩充;连续储备方式(次序表)特点:储备利
17、用率高,存取速度快缺点:插入、删除等操作时需要移动大量数据:链式储备方式(链表)特点:适应表的动态增长和删除;缺点:需要额外的指针储备空间学习必备欢迎下载单链表的类定义: 多个类表达一个概念 单链表 ;分为:链表结点 ListNode类 ,链表 List类;循环链表的概念: 是另一种形式的表示线性表的链表,它的结点结构与单链表相同,与单链表不同的是链表中表尾结点的LINK 域中不是 NULL,而是存放了一个指向链表开头结点的指针,这样,只要知道表中任何一个结点的地址,就能遍历表中其他任何一结点;双向链表的概念:在双向链表的没饿结点中应有两个链接指针作为它的数据成员:1LINK 指示它的前驱结点
18、, RLINK 指示它的后继结点,因此,双向链表的每个结点至少有3 个域: 1LINK 前驱指针 DADA(数据) RLINK (后继指针);栈:定义为只答应在表的末端进行 插入和删除的线性表;特点是:后进先出;递归的定义 :如一个对象部分地包含它自己,或用它自己给自己定义 , 就称这个对象是递归的;如一个过程直接地或间接地调用自己 , 就称这个过程是递归的过程; 以下三种情形经常用到递归方法一; 定义是递归的二; 数据结构是递归的三问题的解法是递归的;队列: 队列是只答应在一端删除, 在另一端插入的次序表答应删除的一端叫做队头, 答应插入的一端叫做队尾;特性:先进先出;优先级队列: 是不同于
19、先进先出队列的另一种队列;每次从队列中取出的是具有最高优先权的元素;多维数组是一维数组的推广;多维数组是一维数组的推广; 多维数组的特点是每一个数据元素可以有多个直接前驱和多个直接后继; 数组元素的下标一般具有固定的下界和上界,因此它比其他复杂的非线性结构简单; 字符串是 n . 0 个字符的有限序列,记作 S :“ c1c2c3 cn ”其中, S 是串名字 c1c2c3 cn”是串值 ci是串中字符 n 是串的长度, n = 0称为空串;广义表是 n 0 个表元素组成的有限序列,记作LS a1, a2, a3, , an, LS 是表名, ai是表元素,可以是表(称为子表),可以是数据元素
20、(称为原子);n 为表的长度;n = 0的广义表为空表;n 0时,表的第一个表元素称为广义表的表头( head ),除此之外,其它表元素组成的表称为广义表的表尾(tail有根树:一棵有根树T ,简称为树,它是n n 0个结点的有限集合;当n = 0 时, T 称为空树;否就, T 是非空树,记作 T=空集 n=0r,T1,T2 .Tn,n0r是一个特定的称为根 root的结点, 它只有直接后继, 但没有直接前驱; 根以外的其他结点划分为 m m . 0个互不相交的有限集合T1, T2, , Tm ,每个集合又是一棵树,并且称之为根的子树; 每棵子树的根结点有且仅有一个直接前驱,但可以有 0 个
21、或多个直接后继二叉树的定义 : 一棵二叉树是结点的一个有限集合,该集合或者为空,或者是由一个根结点加上两棵分别称为左子树和右子树的、互不相交的二叉树组成;完全二叉树 : 如设二叉树的深度为k ,就共有 k层; 除第 k层外, 其它各层 1 k-1的结点数都达到最大个数,第k 层从右向左连续缺如干结点,这就是完全二叉树二叉树的遍历就是按某种次序拜访树中的结点,要求每个结点拜访一次且仅拜访一次;设拜访根结点记作 V 遍历根的左子树记作L遍历根的右子树记作R ;就可能的遍历次序有:前序 VLR 镜像 VRL;中序 LVR 镜像 RVL;后序 LRV 镜像 RLV前序遍历二叉树算法的框架是:如二叉树为
22、空,就空操作;否就拜访根结点V ;前序遍历左子树 L;前序遍历右子树R ;遍历结果 - + a * b - c d / e f树的后根次序遍历 : 当树非空时依次后根遍历根的各棵子树拜访根结点:树后根遍历EFBCGD;A 对应二叉树中序遍历EFBCGDA;树的后根遍历结果与其对应二叉树;表示的中序遍历结果相同:树的后根遍历可以借助对应二叉树的中序遍历算法实现最小堆和最大堆:假如有一个关键码集合K=K0,K1 , K2,K3, .,Kn-1,把它的全部元素按完全二叉树的次序储备方式存放在一个一维数组中;并满意Ki K2i+1 且 Ki K2i+2 或者 Ki K2i+1 且 KiK2i+2 i=
23、0,1, . ( n-2 ) /2 ,就称这个集合为最小堆或最大堆;堆是最高效的一种数据结构,每次出队列的是优先权最高的元素;用堆实现其储备表示, 能够高效运作;堆的建立: 有 2 种方式建立最小的堆, 一种方式是通过第一个构造函数建立一个空堆,其大小通过动态储备安排得到, 另一中建立最小堆的方式是通过其次个构造函数复制一个记录数组并对其加以调整形成一个堆;路径:从树中一个结点到达另一个结点之间的分支构成该两结点之间的路径;路径长度: 是指路径上的分支条数, 树的路径长度是从树的根结点到每一个结点的路径长度之和;由树的定义,从根结点到达书中每一结点有且仅有一条路径;Huffman 树:带权路径
24、长度最小的二叉树应是权值大的外结点离根结点最近的扩充二叉树;带路径长度最小的扩充二叉树不肯定是完全二叉树;集合是成员 元素 的一个群集;集合中的成员可以是原子 单元素 ,也可以是集合;字典是一些元素的集合,每个元素有一个称作关键码(key )的域,不同元素的关键码互不相同;散列方法: 抱负的搜寻方法是可以不经过比较,一次直接从字典中得到要搜寻的元素;假如在元素储备位置与其关键码之间建立一个确定的对应函数关系Hash , 使得每个关键码与结构中一个唯独的储备位置相对应:Address Hashkey;在插入时依此函数运算储备位 置并按此位置存放; 在搜寻时对元素的关键码进行同样的运算,把求得的函
25、数值当做元素存 储位置, 在结构中按此位置搜寻; 这就是散列方法; 在散列方法中所用转换函数叫做散列函数;按此方法构造出来的表叫做散列表;使用散列方法进行搜寻不必进行多次关键码的比较, 搜寻速度比较快 ,可以直接到达或靠近具有此关键码的表项的实际存放地址;散列函数是一个压缩映象函数; 关键码集合比散列表地址集合大得多; 因此有可能经过散列函数的运算,把不同的关键码映射到同一个散列地址上,这就产生了冲突搜寻就是在数据集合中查找满意某种条件的数据对象; 搜寻的结果通常有两种可能: 搜寻胜利,即找到满意条件的数据对象;这时,作为结果,可报告该对象在结构中 的位置 , 仍可给出该对象中的具体信息;搜寻
26、不胜利, 或搜寻失败;作为结果, 应报告一些信息 , 如失败标志、位置等 搜寻结构通常称用于搜寻的数据集合为搜寻结构,它是由同一数据类型的对象 或记录 组成;在每个对象中有如干属性, 其中有一个属性, 其值可唯独地标识这个对象;称为关键码;使用基于关键码的搜寻,搜寻结果应是唯独的;但在实际应用时,搜寻条件是 多方面的, 可以使用基于属性的搜寻方法,但搜寻结果可能不唯独; 实施搜寻时有两种不同的环境;静态环境,搜寻结构在插入和删除等操作的前后不发生转变;. 静态搜寻表 动态环境,为保持较高的搜寻效率,搜寻结构在执行插入和删除等操作的前后将自动进行调整,结构可能发生变化; . 动态搜寻表次序搜寻主
27、要用于在线性表中搜寻;设如表中有CurrentSize个元素,就次序搜寻从表的 先端开头,次序用各元素的关键码与给定值x进行比较如找到与其值相等的元素,就搜寻 胜利,给出该元素在表中的位置;如整个表都已检测完仍未找到关键码与x相等的元素, 就搜寻失败;给出失败信息二叉搜寻树或者是一棵空树,或者是具有以下性质的二叉树:1 每个结点都有一个作为搜寻依据的关键码 key ,全部结点的关键码互不相同;2 左子树(假如非空)上全部结点的关键码都小于根结点的关键码;3 右子树(假如非空)上全部结点的关键码都大于根结点的关键码; 4 左子树和右子树也是二叉搜寻树;二叉搜寻树为二叉排序树假如对一棵二叉搜寻树进
28、行中序遍历,可以按从小到大的次序, 将各结点关键码排列起来,所以也称二叉搜寻树为二叉排序树在二叉搜寻树上进行搜寻,是一个从根结点开头,沿某一个分支逐层向下进行比较判等的过 程;它可以是一个递归的过程;假设想要在二叉搜寻树中搜寻关键码为x的元素,搜寻过程从根结点开头;假如根指针为NULL,就搜寻不胜利;否就用给定值x与根结点的关键码进行比较: 如给定值等于根结点关键码,就搜寻胜利, 返回搜寻胜利信息并报告搜寻到结点地址; 如给定值小于根结点的关键码,就连续递归搜寻根结点的左子树;否就;递归搜寻根结点的右子 二叉搜寻树的插入算法:为了向二叉搜寻树中插入一个新元素,必需先检查这个元素是否在树中已经存
29、在;在插入之前, 先使用搜寻算法在树中检查要插入元素有仍是没有;假如搜寻胜利,说明树中已经有这个元素,不再插入;假如搜寻不胜利,说明树中原先 没有关键码等于给定值的结点,把新元素加到搜寻操作停止的地方;图定义:图是由顶点集合vertex及顶点间的关系集合组成的一种数据结构:Graph V, E 其中 V = x | x .某个数据对象 是顶点的有穷非空集合;E = x, y | x, y . V 或 E = |x,y . V & Path x,y ,是顶点之间关系的有穷集合,也叫做边edge集合; Path x,y 表示从 x到 y的一条单向通路 ,它是有方向的;有向图与无向图:在有向图中,顶
30、点对是有序的;在无向图中,顶点对x, y是无序的;完全图: 如有 n个顶点的无向图有nn-1/2条边 ,就此图为完全无向图;有 n个顶点的有向图有 nn-1条边,就此图为完全有向图在图的邻接矩阵表示中, 有一个记录各个顶点信息的顶点表,仍有一个表示各个顶点之间关系的邻接矩阵;邻接表是邻接矩阵的改进形式;为此需要把邻接矩阵的各行分别组织为一个单链表;在邻接表中,同一个顶点发出的边链接在同一个边链表中,每一个链结点代表一条边(边结点),结点中有另一顶点的下标dest和指针 link;对于带权图,边结点中仍要储存该边的权值 cost ;顶点表的第 i个顶点中储存该顶点的数据,以及它对应边链表的头指针adj最短路径问题:假如从图中某一顶点(称为源点)另一顶点(称为终点)的路径可能不止一条,如何找到一条路径使得沿此路径上各边上的权值总和达到最小;排序:将一组杂乱无章的数据按肯定的规律顺次排列起来;数据表 datalist:它是待排序数据元素的有限集合;排序码 key:通常数据元素有多个属性域,即多个数据成员组成 ,其中有一个属性域可用 来区分元素 ,作为排序依据; 该域即为排序码; 每个数据表用哪个属性域作为排序码,要视具体的应用需要而定;插入排序基本方法是: 每步将一个待排序的元素, 按其排序码大小, 插入到前面已经排好序的一组元素的适当位置上,直到元素全部插入为止;