《数据库相关知识点总结.doc》由会员分享,可在线阅读,更多相关《数据库相关知识点总结.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、知识点1 数据库的基本概念 P1-3知识点2 数据库系统的发展和基本特点 P3-4知识点3 数据库系统的内部体系结构 P5-7知识点4 数据模型的基本概念 P7-9知识点5 E-R 模型 P9-9知识点6 关系模型 P9-11知识点7 关系代数 P1-12知识点8 数据库设计与原理 P12-14知识点1 数据库的基本概念1、数据(Data)是描述事物的符号,分临时数据(随程序结束而消亡)和持久性数据(对系统起着长期持久作用的作用)。数据有型和值之分2、数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。3、数据库管理系统(Database Manageme
2、nt System,简称 DBMS)位于应用程序和操作系统之间,是为建立、使用和维护数据库而配置的一层数据管理软件,负责对数据库中的数据进行统一的管理和控制。4、数据库管理系统的四大功能)数据定义功能:提供数据定义语言(DDL) 定义数据库中的数据对象)数据操纵功能:提供数据操纵语言(DML)运行管理:保证数据的安全性、完整性、并发控制、系统恢复)数据库的建立和维护功能:数据库数据批量装载、数据库转储、介质故障恢复等5、数据库系统是指带有数据库的计算机系统。包括数据库、数据库管理系统、应用程序、数据库管理员以及用户等部分。用户1用户2用户n 数据库系统示意图数据库管理系统数据库应用程序数据库管
3、理员6、数据库系统的特点)数据的整体结构化。 )数据的共享性高,冗余度低。 )数据的独立性高。分为物理独立性和逻辑独立性。物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。)数据的统一管理和控制。 7、数据库管理员有三个主要工作) 数据库设计)数据库维护)改善系统性能,提高系统效率8、数据库应用系统是数据库系统再加上应用软件及应用界面这三者组成,即具体包括数据库、数据库管理系统、数据库管理员、硬件平台、软件平台、应用软件、应用界面9
4、、基本概念的界定数据数据库软件数据库管理系统系统数据库系统学科数据库技术知识点2 数据库系统的发展和基本特点人工管理阶段示意图程序n程序2程序1数据n数据2数据1文件系统管理系统示意图程序n程序2程序1文件系统数据n数据2数据1数据管理技术的发展阶段及时间产生背景特点应用需求硬件水平软件水平管理者面向对象共享程度独立性结构化控制能力人工管理阶段(40年代中50年代中)科学计算无直接存取存储设备没有操作系统应用程序,数据不保存某一应用程序无共享、冗余度极大不独立,完全依赖与程序无结构应用程序自己控制文件系统管理阶段(50年代末60年代中)科学计算、管理磁盘、磁鼓有文件系统文件系统,数据可长期保存
5、某一应用程序共享性差、冗余度大记录内有结构,无结构独立性差,数据的逻辑结构改变必须修改应用程序应用程序自己控制数据库系统管理阶段(60年代末以来)大规模管理大容量磁盘有数据库管理系统DBMS现实世界共享性高冗余度低高度的物理独立性和一定的逻辑独立性整体结构化由DBMS统一管理和控制总结:由于应用需求的需要,硬件水平、软件水平的提高,数据管理技术逐渐发展。它的面向对象不断扩大,共享程度更高,日趋独立,整体结构化,由数据库管理系统统一管理和控制。注:数据库系统的特点见知识点1中的第六点。程序n数据库数据库管理系统程序2程序1数据库系统管理阶段示意图知识点3 数据库系统的内部体系结构1、数据库系统的
6、体系结构图程序1程序2程序k程序j数据库外模式1外模式n模式内模式外模式/模式映射模式/内模式映射从数据库管理系统角度看,数据库系统通常采用三级模式结构和两级映射。三级模式结构是由外模式、模式和内模式三级组成 2、三级模式结构()模式(也称逻辑模式、概念模式))是数据库中全局数据的逻辑结构和特征的描述)所有用户的公共数据视图,综合了所有用户的需求)主要描述数据的概念记录类型以及它们之间的关系)一个数据库只有一个模式()模式的地位)是数据库系统模式结构的中间层)与数据的物理存储细节和硬件环境无关)与具体的应用程序、开发工具及高级程序设计语言无关()外模式(也称子模式或用户模式))是数据库用户(包
7、括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述)它由概念模式推导而出;)一个概念模式可以有若干个外模式()外模式的地位 介于模式与应用之间()内模式(也称存储模式、物理模式))是数据物理结构和存储方式的描述)是数据在数据库内部的表示方式)一个数据库只有一个内模式小结:模式、外模式、内模式三者地位关系()内模式是处于最底层,反映了数据在计算机物理结构中的实际存储形式;()概念模式处于中层,它反映了设计者的数据全局逻辑要求;()外模式处于最外层,它反映了用户对数据的要求。3、二级映射()外模式模式映射)定义外模式与模式之间的对应关系)每一个外模式都对应一个外模式模式映射注:
8、映射又称为映像,它实质就是一种对应规则,指出映射双方如何进行转换。()外模式模式映射的用途 保证数据的逻辑独立性)当模式改变时,数据库管理员修改有关的外模式模式映射,使外模式保持不变。)应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。()模式内模式映射)模式内模式映射定义了数据全局逻辑结构与存储结构之间的对应关系。)数据库中模式内模式映射是唯一的。()模式内模式映象的用途 保证数据的物理独立性)当数据库的存储结构改变了,数据库管理员修改模式内模式映象,使模式保持不变。)应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立
9、性。知识点4 数据模型的基本概念1、将客观事物抽象为能用计算机存储和处理的数据需经历三个阶段:现实世界、信息世界、计算机世界(数据世界)2、模型是现实世界特征的模拟和抽象。3、数据模型应满足三方面要求:)能比较真实地模拟现实世界;)容易为人所理解;)便于在计算机上实现。4、根据数据模型的应用目的不同,数据模型分为三类 )概念模型,也称信息模型,它是按用户的观点来对数据进行描述,有效和自然地模拟现实世界,给出数据的概念化结构。概念模型强调以人为本,注重清晰、简单、易于理解;)逻辑数据模型,它是按计算机系统的观点对数据进行描述。逻辑数据模型以计算机为本,站在计算机的角度去看待各个数据及数据之间的联
10、系。)物理模型,给出计算机上物理结构的表示。 5、数据模型的定义 数据模型(Data Model)是数据特征的抽象,它从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据系统的信息表示与操作提供一个抽象的框架。6、数据模型的组成要素)数据结构:数据结构是所研究的对象类型的集合。 )数据操作:数据操作是指对相应数据结构允许执行的操作的集合,包括操作及有关的操作规则 )数据的完整性约束:数据的完整性约束是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,以保证数据的正确、有效和相容。7、实体-联系数据模型实体:客观存在并可相互区别的事物称为实体(Enti
11、ty)。实体可以是具体的人、事、物,也可以是抽象的概念或联系。属性:实体的特性称为实体的属性(Attribute)。一个实体可以由若干个属性来刻画。码:能唯一的标识实体的属性集合称为码(Key)。域:属性的取值范围称为该属性的域(Domain)。联系:(Relationship)在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体集内部的联系和实体集之间的联系。8、两个实体集之间的联系分为三类:一对一联系(1:1)一对多联系(1:n)多对多联系(n:n)知识点5 E-R模型E-R图的表示:实体型:用矩形表示,矩形框内写明实体名。 属性:用椭圆形表示,椭圆形内写明属性名,
12、并用无向边将其与相应的实体连接起来。 联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体或联系连接起来,同时在无向边旁标上联系的类型。知识点6 关系模型数据库领域中最常用的数据模型有四种:层次模型、网状模型、关系模型和面向对象模型。其中层次模型和网状模型统称为非关系模型()层次模型用树形结构来表示各类实体以及实体间的联系。()有且只有一个结点没有双亲结点,这个结点称为根结点。()根以外的其他结点有且只有一个双亲结点。特点 任何一个给定的记录值只有按其路径查看时,才能显示出它的全部意义,没有一个子女记录值能够脱离双亲记录值而独立存在。()网状模型 有效的克服了层次模型不方便表达多对多
13、的联系的缺点,但由于网状模型的灵活性,数据库管理系统很难实现)允许一个以上的结点无双亲;)一个结点可以有多于一个的双亲。()关系模型中的数据结构是一张二维表,它由行和列组成。关系(Relation):一个关系对应一张二维表。关系的名称一般取为表格的名称或按表格名称的意思取名。元组(Tuple):表中的一行即为一个元组。 属性(Atturibute):表中的一列即为一个属性,每一列的第一行是属性名,其余行是属性值。 主码(Key):表中的某个属性或属性组合,它可以唯一标识一个元组。关系模式:对关系的描述,一般表示为: 关系名(属性名1,属性名2,属性名n)()关系应满足如下性质) 关系必须是规范
14、化的,即要求关系必须满足一定的规范条件,其中最基本的一条就是,关系的每一列不可再分。关系中必须有主码,使得元组唯一。)元组的个数是有限的且元组的顺序可以任意交换。)属性名是唯一的且属性列的顺序可以任意交换。()关系完整性规则实体完整性规则 主码的属性值不能为空值。因为如果出现空值,那么主码就无法保证元组的唯一性。参照完整性规则 在关系模式中实体以及实体之间的联系是用关系来描述的,所以自然存在着关系与关系之间的联系,而关系之间的联系是靠公共属性实现的,如果这个公共属性是一个关系R1的主码,那么在另一个与它有联系的关系R2中就称为外码。参照完整性规则告诉我们外码的取值只有两种可能,要么是空值,要么
15、等于R1中某个元组的主码值。用户定义完整性 反映某一具体应用所涉及的数据必须满足的语义要求。 知识点7 关系代数关系操作的对象是关系,结果也是关系。 查询:在一或多个关系中查找满足条件的列或行,得到一个新的关系。插入:在指定的关系中插入一个或多个元组。删除:将指定关系中的一个或多个满足条件的元组删除。修改:对指定关系中满足条件的一个或多个元组修改其数据项的值。投影:功能是选择关系中的某些属性,生成一个新的关系。选择:在一个关系中,选取符合给定条件的所有元组,生成新的关系。自然连接:将两个具有公共属性的关系,按照公共属性值相等的条件连接成为一个新的关系。数据查询是数据库的核心操作 SELECT查
16、询语句的基本格式为: SELECT ALL | * , FROM , WHERE 查询满足条件的元组是通过where子句实现的。Where子句中常用的查询条件包括比较大小、字符匹配、多重条件等。常用的比较运算符有:关系运算符: ,大于等于=,小于等于=,=,不等于;逻辑运算符:逻辑与AND,逻辑或OR,逻辑非NOT 。插入数据:插入单个元组的语句格式为: INSERT INTO (,) VALUES ( , )修改数据:修改语句的一般格式为:UPDATE SET=,= WHERE ;删除数据:删除语句的一般格式为:DELETE FROM WHERE ;知识点8 数据库设计与原理数据库设计(Da
17、tabase Design):设计一个能满足用户要求,性能良好的数据库。数据设计的基本任务:更具用户对象的信息需求、处理需求和数据库的支撑环境(硬件、OS与DBMS)设计出数据模式。数据库设计目前采用生命周期法,即将整个数据库应用系统的开发分解成目标独立的若干个阶段。数据库设计的六个阶段:需求分析、概念设计、逻辑设计、物理设计、编码阶段、测试阶段、运行维护阶段。需求分析是整个数据库设计的基础,其目的是准确了解与分析用户的各种需求 (1) 需求调查 (2) 需求总结数据流图(Data Flow Diagram,DFD)数据字典:数据项、数据结构、数据流、数据存储、处理逻辑概念结构设计 应能真实、
18、充分地反映现实世界,是现实世界中具体应用的一个真实模型;易于向关系、网状、层次等各种数据逻辑模型转换。设计步骤:数据抽象:数据抽象就是对需求分析阶段收集到的数据进行分类、组织,形成实体、实体的属性,并标识实体的主码、确定实体之间的联系类型(1:1,1:n,m:n)。抽象方法有:分类、聚集和概括。选择局部应用,设计局部视图:根据实际系统的具体情况,在多层的数据流图中选择一个适当的层次,作为概念结构设计的入口,设计各个分E-R图即局部视图视图的集成:各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构,即总E-R图。消除冗余数据(指可由基本数据导出的数据)和冗余联系
19、(指可由其它联系导出的联系)。冗余数据和冗余联系容易破坏数据库的完整性,增加维护的困难。消除冗余主要是通过分析发现冗余并消除冗余。说明并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不以冗余信息作为代价逻辑结构设计步骤()将概念结构转化为一般的关系、网状、层次模型()将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换()对数据模型进行优化物理结构设计其目的:对数据库内部物理结构做调整并选取合理的存取路径,以提高数据的访问速度及有效利用存储空间。数据库实施阶段:设计人员根据逻辑结构设计和物理结构设计的结果建立数据库,编制与调试应用程序,并进行试运行和评价。数据库维护阶段:在数据库系统运行过程中必须不断地对其进行评价、调整与修改。