《数据库知识点整理笔记word.doc》由会员分享,可在线阅读,更多相关《数据库知识点整理笔记word.doc(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据(Data)是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等数据的特点:数据与其语义是不可分的(数据的含义称为数据的语义)数据库(Database,简称DB)是长期储存在计算机内,有组织的、可共享的、大量的数据的集合。数据库数据具有:永久存储、有组织和可共享三个基本特点数据库管理系统Database Manangement System,DBMS定义1:位于用户与操作系统之间的一层数据管理软件。定义2:由一个相互关联的数据的集合和一组用于访问这些数据的程序组成。DBMS的用途:科学地组织和存储数据、高效地获取和
2、维护数据。DBMS的主要功能:(是数据库系统的重要组成部分)数据定义功能(DDL,Data Definition Language),用户通过它可以方便地定义数据库表、索引、视图等数据对象。数据操纵功能(DML,Data Manipulation Language),对数据库进行增删改查。数据库的运行管理(安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复)数据库的建立和维护(数据输入、转储、性能监视等)数据库系统(Database System,简称DBS):在计算机系统中引入数据库后的系统。由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员、用户构成。数据管理:是对
3、数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据管理技术的发展过程:人工管理阶段(20世纪40年代中-50年代中):特点数据不保存;应用程序管理数据;数据无共享、冗余度极大;数据不独立;完全依赖于程序文件系统阶段(20世纪50年代末-60年代中):优点:数据可长期保存;把数据组织成内部有结构的记录; -“按文件名访问、按记录进行存取”。缺点:共享性差、冗余度大(数据部分相同,也要各自建立文件);独立性差,数据的逻辑结构改变必须修改应用程序。完整性问题 原子性问题 并发访问异常 安全性问题 数据库系统阶段(20世纪60年代末-现在):不仅解决了数据的永久保存,而且真正实现了数
4、据的方便查询和一致性维护问题,并且能严格保证数据的安全。数据库系统的特点:数据结构化:是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。(整体结构化:不再仅仅针对某一个应用,而是面向全组织;不仅数据内部结构化,整体是结构化的,数据之间具有联系) 数据的共享性高,冗余度低,易扩充:数据库系统从整体角度看待和描述数据,数据面向整个系统,可以被多个用户、多个应用共享使用。数据共享的好处:减少数据冗余,节约存储空间;避免数据之间的不相容性与不一致性 ;使系统易于扩充数据独立性高:物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。逻
5、辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。数据独立性是由DBMS的二级映像功能来保证的数据由DBMS统一管理和控制:DBMS提供的数据控制功能(1)数据的安全性(Security)保护(2)数据的完整性(Integrity)检查(3)并发(Concurrency)控制(4)数据库恢复(Recovery)数据模型就是现实世界数据特征的抽象。数据模型是用来描述数据、组织数据、对数据进行操作。数据模型应满足三方面要求:能比较真实地模拟现实世界、容易为人所理解、便于在计算机上实现数据模型分为两类(模型应用的不同目的)(1)概念模型:也称信息模型
6、,它是按用户的观点来对数据和信息建模,用于数据库设计。 (2)逻辑模型和物理模型 逻辑模型:按计算机系统的观点对数据建模,用于DBMS实现。 物理模型:对数据最底层的抽象,存储方式和存取方法。客观对象的抽象过程-两步抽象1、现实世界中的客观对象抽象为概念模型;2、把概念模型转换为某一DBMS支持的数据模型。数据模型的组成要素:数据结构:描述数据库的组成对象,以及对象之间的联系。人们通常按数据结构的类型来命名数据模型(层次模型、网状模型、关系模型)。数据操作:对数据库中各种对象(型)的实例(值)允许执行的,操作的集合及有关的操作规则。类型分为:查询、更新(包括插入、删除、修改)完整性约束条件:数
7、据的完整性约束条件:一组完整性规则的集合。是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。数据模型对完整性约束条件的定义:反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。概念模型的用途:概念模型用于信息世界的建模是现实世界到机器世界的一个中间层次是数据库设计的有力工具数据库设计人员和用户之间进行交流的语言对概念模型的基本要求能够方便、直接地表达应用中的
8、各种语义知识(模拟现实世界)简单、清晰、易于用户理解(容易为人们所理解)可以用实体-联系图(E-R)来表示概念模型信息世界中的基本概念(1) 实体(Entity):客观存在并可相互区别的事物称为实体。可以是具体的人、事、物或抽象的概念。(人、银行账户)(2) 属性(Attribute):实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。(实体通过属性集合描述)(某个账户)(3) 码(Key):唯一标识实体的属性集称为码。(4) 域(Domain):属性的取值范围称为该属性的域。 (5) 实体型(Entity Type):用实体名及其属性名集合来抽象和刻画同类实体称为实体型(6) 实
9、体集(Entity Set):同一类型实体的集合称为实体集(7) 联系(Relationship):现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系实体之间的联系通常是指不同实体集之间的联系二、两个实体型之间的联系一对一联系:如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1 一对多联系:如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联
10、系,则称实体集A与实体集B有一对多联系,记为1:n多对多联系:如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体B具有多对多联系,记为m:n实体联系方法(Entity-Relationship approach)用E-R图来描述现实世界的概念模型E-R方法也称为E-R模型E-R图提供了表示实体型、属性和联系方法。实体型:用矩形表示,矩形框内写明实体名。属性:用椭圆形表示,并用无向边将其与相应的实体连接起来联系:联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来
11、,同时在无向边旁标上联系的类型(1:1、1:n或m:n) 联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来 最常用的数据模型:1、非关系模型(格式化模型)层次模型(Hierarchical Model):数据库系统中最早出现的数据模型,用树形结构来表示各类实体以及实体间的联系。(层次模型的完整性约束条件:无相应的双亲结点值就不能插入子女结点值如果删除双亲结点值,则相应的子女结点值也被同时删除更新操作时,应更新所有相应记录,以保证数据的一致性优点:层次模型的数据结构比较简单清晰 查询效率高,性能优于关系模型,不低于网状模型层次数据模型
12、提供了良好的完整性支持缺点:多对多联系表示不自然对插入和删除操作的限制多,应用程序的编写比较复杂 查询子女结点必须通过双亲结点由于结构严密,层次命令趋于程序化 )(网状模型(Network Model):网状数据库系统采用网状模型作为数据的组织方式。网状模型是满足下面两个条件的基本层次联系的集合:1. 允许一个以上的结点无双亲;2. 一个结点可以有多于一个的双亲。(表示方法(与层次数据模型相同)实体型:用记录类型描述 每个结点表示一个记录类型(实体)属性:用字段描述 每个记录类型可包含若干个字段联系:用结点之间的连线表示记录类型(实体)之 间的一对多的父子联系网状模型与层次模型的区别网状模型允
13、许多个结点没有双亲结点网状模型允许结点有多个双亲结点网状模型允许两个结点之间有多种联系(复合联系)网状模型可以更直接地去描述现实世界层次模型实际上是网状模型的一个特例优点:能够更为直接地描述现实世界,如一个结点可以有多个双亲具有良好的性能,存取效率较高缺点:结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握DDL、DML语言复杂,用户不容易使用)2、关系模型(Relational Model):关系数据库系统采用关系模型作为数据的组织方式。计算机厂商新推出的数据库管理系统几乎都支持关系模型。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
14、 (关系(Relation):一个关系对应通常说的一张表元组(Tuple):表中的一行即为一个元组属性(Attribute):表中的一列即为一个属性,给每一个属性起一个名称即属性名主码(Key):表中的某个属性组,它可以唯一确定一个元组。域(Domain):属性的取值范围。分量:元组中的一个属性值。关系模式:对关系的描述、关系名(属性1,属性2,属性n)、学生(学号,姓名,年龄,性别,系,年级)关系模型中,实体以及实体之间的联系都是用关系来表示关系必须是规范化的,满足一定的规范条件。最基本的规范条件:关系的每一个分量必须是一个不可分的数据项, 不允许表中还有表 数据操作是集合操作,操作对象和操
15、作结果都是关系,即若干元组的集合存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”关系的完整性约束条件:包括实体完整性、参照完整性、用户定义的完整性实体及实体间的联系都用表来表示表以文件形式存储优点1、建立在严格的数学概念的基础上2、概念单一:实体和各类联系都用关系来表示;对数据的检索结果也是关系3、关系模型的存取路径对用户透明:具有更高的数据独立性,更好的安全保密性;简化了程序员的工作和数据库开发建立的工作缺点1、存取路径对用户透明导致查询效率往往不如非关系数据模型2、为提高性能,必须对用户的查询请求进行优化增加了开发DBMS的难度)面向对象模型(Object Oriente
16、d Model)对象关系模型(Object Relational Model)数据库系统结构从数据库管理系统角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构 从数据库最终用户角度看(数据库系统外部的体系结构) ,数据库系统的结构分为:单用户结构、主从式结构、分布式结构、客户服务器、浏览器应用服务器数据库服务器多层结构等数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,这就是数据抽象,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果。对用户来说,了解数据库中用来表示数据的复杂的数据结构没有太大的必要。数据库管理系
17、统通过如下三个层次的抽象来向用户屏蔽复杂性,简化系统的用户界面。1、 物理层抽象:最低层次的抽象,描述数据实际上是如何存储的。物理层详细描述复杂的低层数据结构,是开发DBMS的数据库供应商应该研究的事情。(内模式)2、逻辑层抽象:比物理层稍高层次的抽象,描述数据库中存储什么数据以及这些数据间存在什么关系。因而整个数据库可通过少量相对简单的结构来描述。虽然简单的逻辑层结构的实现涉及到复杂的物理层结构,但逻辑层的用户不必知道这种复杂性。逻辑层抽象是由数据库管理员和数据库应用开发人员使用的,他们必须确定数据库中应该保存哪些信息。(模式) 3、视图层(概念层)抽象:最高层次的抽象,但只描述整个数据库的
18、某个部分。尽管在逻辑层使用了比较简单的结构,但由于数据库的规模巨大,所以仍存在一定程度的复杂性。数据库系统的多数用户并不需要关心所有的信息,而只需要访问数据库的一部分。视图抽象层的定义正是为了使用户与系统的交互更简单。系统可以为同一数据库提供多个视图,而视图又保证了数据的安全性。(外模式) 数据库系统模式的概念型(Type):对某一类数据的结构和属性的说明值(Value):是型的一个具体赋值模式(Schema):数据库逻辑结构和特征的描述;是型的描述;反映的是数据的结构及其联系;模式是相对稳定的实例(Instance):模式的一个具体值;反映数据库某一时刻的状态;同一个模式可以有很多实例;实例
19、随数据库中的数据的更新而变动数据库系统的三级模式结构:模式(Schema)、外模式(External Schema)、内模式(Internal Schema) 模式(也称逻辑模式):数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图。综合了所有用户的需求。一个数据库只有一个模式模式的地位:是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关模式的定义:包括数据的逻辑结构(数据项的名字、类型、取值范围等)、数据之间的联系、数据有关的安全性、完整性要求外模式(也称子模式或用户模式):是数据库用户(包括应用程序员和最终用户)能
20、够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示外模式的地位:介于模式与应用之间模式与外模式的关系:一对多外模式通常是模式的子集一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同外模式与应用的关系:一对多同一外模式也可以为某一用户的多个应用系统所使用但一个应用程序只能使用一个外模式外模式的用途:保证数据库安全性的一个有力措施;每个用户只能看见和访问所对应的外模式中的数据内模式(也称存储模式):是数据物理结构和存储方式的描述,是数据在数据
21、库内部的表示方式。包括:记录的存储方式(堆存储,按某个属性值升、降序存储,聚簇存储)、索引的组织方式(按照B树结构存储,按hash方法存储)、数据是否压缩存储、数据是否加密、数据存储记录结构的规定(变长、定长)一个数据库只有一个内模式数据库的二级映像功能与数据独立性三级模式是对数据的三个抽象级别二级映象在DBMS内部实现这三个抽象层次的联系和转换:外模式模式映像、模式内模式映像 外模式模式映像:每一个外模式,数据库系统都有一个外模式模式映象,定义外模式与模式之间的对应关系映象定义通常包含在各自外模式的描述中保证数据的逻辑独立性:1、 当模式改变时(新关系、属性等),数据库管理员修改有关的外模式
22、模式映象,使外模式保持不变。2、应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。模式内模式映象:定义了数据全局逻辑结构与存储结构之间的对应关系。数据库中模式内模式映象是唯一的该映象定义通常包含在模式描述中保证数据的物理独立性:1、 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式内模式映象,使模式保持不变2、应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去 数据的存取由DBMS管理:用户不必考虑存取路径等细节;简化了应用
23、程序的编制;大大减少了应用程序的维护和修改 数据库系统的组成:数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员一、硬件平台及数据库数据库系统对硬件资源的要求(1) 有足够大的内存,来存放操作系统、DBMS的核心模块、数据缓冲区、应用程序。(2) 足够大的外存,要有足够大的磁盘或磁盘阵列来存放数据库,有足够大的光盘、磁带作数据备份(3) 较高的通道能力,提高数据传送率二、软件DBMS,DBMS是为数据库的建立、使用和维护配置的软件支持DBMS运行的操作系统与数据库接口的高级语言及其编译系统,便于开发应用程序以DBMS为核心的应用开发工具。应用开发工具是为应用开发人员和最终用户提供的
24、高效率、多功能的应用生成器、第四代语言等各种软件工具。它们为数据库系统的开发和应用提供了良好的环境。为特定应用环境开发的数据库应用系统三、人员数据库管理员:具体职责: 1.决定数据库中的信息内容和结构2.决定数据库的存储结构和存取策略3.定义数据的安全性要求和完整性约束条件4.监控数据库的使用和运行:周期性转储数据库(数据文件、日志文件);系统故障恢复;介质故障恢复;监视审计文件5. 数据库的改进和重组:性能监控和调优;定期对数据库进行重组织,以提高系统的性能;需求增加和改变时,数据库须需要重构造系统分析员和数据库设计人员系统分析员:负责应用系统的需求分析和规范说明:与用户及DBA协商,确定系
25、统的硬软件配置:参与数据库系统的概要设计数据库设计人员:加用户需求调查和系统分析,确定数据库中的数据设计数据库各级模式应用程序员:设计和编写应用系统的程序模块、进行调试和安装用户:是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。 1. 偶然用户:不经常访问数据库,但每次访问数据库时往往需要不同的数据库信息 (企业或组织机构的高中级管理人员)2. 简单用户:主要工作是查询和更新数据库 (银行的职员、机票预定人员、旅馆总台服务员)3. 复杂用户:直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的API编制自己的应用程序(工程师、科学家、经济学家、科技工作者等)关
26、系数据库关系数据库应用数学方法来处理数据库中的数据。关系数据结构及形式化定义从集合论的角度给出关系数据结构的形式化定义。1.域(Domain):域是一组具有相同数据类型的值的集合。笛卡尔积(Cartesian Product):给定一组域D1,D2,Dn,这些域中可以有相同的。D1,D2,Dn的笛卡尔积为: D1D2Dn (d1,d2,dn)diDi,i1,2,n元组(Tuple):笛卡尔积中每一个元素(d1,d2,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)分量(Component):笛卡尔积元素(d1,d2,dn)中的每一个值di叫作一个分量基数(Cardinal num
27、ber):若Di(i1,2,n)为有限集,其基数为mi(i1,2,n),则D1D2Dn的基数M等于所有mi的和。笛卡尔积的表示方法:笛卡尔积可表示为一个二维表表中的每行对应一个元组,表中的每列对应一个域3. 关系(Relation):D1D2Dn的子集叫作在域D1,D2,Dn上的关系,表示为R(D1,D2,Dn) R:关系名 n:关系的目或度(Degree)元组:关系中的每个元素是关系中的元组,通常用t表示。单元关系与二元关系当n=1时,称该关系为单元关系(Unary relation) 或一元关系 当n=2时,称该关系为二元关系(Binary relation)关系的表示:关系也是一个二维表
28、,表的每行对应一个元组,表的每列对应一个域。属性:关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute),n目关系必有n个属性候选码(Candidate key):若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。 简单的情况:候选码只包含一个属性全码(All-key):最极端的情况:关系模式的所有属性组是这个关系模式的候选码,称为全码主码(Primary key):若一个关系有多个候选码,则选定其中一个为主码(Primary key)主属性(Prime attribute):候选码的诸(所有)属性称为主属性(Prime attrib
29、ute)不包含在任何侯选码中的属性称为非主属性( Non-Prime attribute)或非码属性(Non-key attribute) D1,D2,Dn的笛卡尔积的某个子集才有实际含义三类关系基本关系(基本表或基表):实际存在的表,是实际存储数据的逻辑表示查询表:查询结果对应的表视图表:由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据基本关系的性质 列是同质的(Homogeneous) 不同的列可出自同一个域 列的顺序无所谓,,列的次序可以任意交换 任意两个元组的候选码不能相同 行的顺序无所谓,行的次序可以任意交换 分量必须取原子值关系模式(Relation Schema)是型,
30、关系是值关系模式是对关系的描述u 元组集合的结构:属性构成、属性来自的域、属性与域之间的映象关系u 元组语义以及完整性约束条件u 属性间的数据依赖关系集合关系模式可以形式化地表示为:R(U,D,DOM,F)R 关系名 U 组成该关系的属性名集合D 属性组U中属性所来自的域DOM 属性向域的映象集合F 属性间的数据依赖关系集合关系模式通常可以简记为R (U) 或 R (A1,A2,An)R: 关系名A1,A2,An : 属性名注:域名及属性向域的映象常常直接说明为属性的类型、长度关系模式:对关系的描述,静态的、稳定的关系:关系模式在某一时刻的状态或内容,动态的、随时间不断变化的关系模式和关系往往
31、统称为关系。通过上下文加以区别并关系数据库模式,对关系数据库的描述。关系数据库模式包括:若干域的定义、在这些域上定义的若干关系模式关系数据库的值: 关系模式在某一时刻对应的关系的集合,简称为关系数据库关系模型给出了关系操作的能力的说明:不对RDBMS语言给出具体的语法要求,不同RDBMS可以定义和开发不同的语言来实现这些操作。常用的关系操作:查询:选择、投影、连接、并、交、差、除,黑体是5中基本操作数据更新:插入、删除、修改查询的表达能力是其中最主要的部分关系操作的特点:集合操作方式:操作的对象和结果都是集合。关系代数语言(代数方式):用对关系的运算来表达查询要求关系演算语言(逻辑方式):用谓
32、词来表达查询要求、元组关系演算语言、域关系演算语言 具有关系代数和关系演算双重特点的语言:代表:SQL(Structured Query Language)、不仅具有查询还具有数据定义和数据控制 实体完整性和参照完整性:关系模型必须满足的完整性约束条件,称为关系的两个不变性,应该由关系系统自动支持实体完整性规则(Entity Integrity):若属性A是基本关系R的主属性,则属性A不能取空值实体完整性规则的说明(1) 实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。(2) 现实世界中的实体是可区分的,即它们具有某种唯一性标识。(3) 关系模型中以主码作为唯一性标
33、识。(4) 主码中的属性即主属性不能取空值:主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第(2)点相矛盾,因此这个规则称为实体完整性在关系模型中实体及实体间的联系都是用关系来描述的,因此可能存在着关系与关系间的引用。设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码基本关系R称为参照关系(Referencing Relation)基本关系S称为被参照关系(Referenced Relation)或目标关系(Target Relation)关系R和S不一定是不同的关系目标关系S的主码Ks 和参照关系的外码F必
34、须定义在同一个(或一组)域上外码并不一定要与相应的主码同名,当外码与相应的主码属于不同关系时,往往取相同的名 字,以便于识别参照完整性规则:若属性(或属性组)F是基本关系R的外码它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:或者取空值(F的每个属性值均为空值)或者等于S中某个元组的主码值例1:学生关系中每个元组的“专业号”属性只取两类值:(1)空值,表示尚未给该学生分配专业(2)非空值,这时该值必须是专业关系中某个元组的“专业号”值,表示该学生不可能分配一个不存在的专业用户定义的完整性:应用领域需要遵循的约束条件,体现了具体领域中的语义
35、约束 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。关系代数:分为传统集合运算符和专门的关系运算符传统集合运算符1.并(Union)R和S:具有相同的目n(即两个关系都有n个属性),相应的属性取自同一个域RS :仍为n目关系,由属于R或属于S的元组组成RS = t|tRtS ,去重复元组2. 差(Difference)R和S:具有相同的目n,相应的属性取自同一个域R - S :仍为n目关系,由属于R而不属于S的所有元组组成?R -S = t|tRtS 3.交
36、(Intersection)R和S:具有相同的目n,相应的属性取自同一个域RS:仍为n目关系,由既属于R又属于S的元组组成RS = t|tRtS RS = R (R-S)4.笛卡尔积(Cartesian Product)严格地讲应该是广义的笛卡尔积(Extended Cartesian Product) R: n目关系,k1个元组S: m目关系,k2个元组RS :列:(n+m)列元组的集合元组的前n列是关系R的一个元组后m列是关系S的一个元组行:k1k2个元组RS = |trR tsS 专门的关系运算(1) R,tR,tAi:设关系模式为R(A1,A2,An),它的一个关系设为R,tR表示t是
37、R的一个元组, tAi则表示元组t中相应于属性Ai的一个分量 (2) A,tA,:若A=Ai1,Ai2,Aik,其中Ai1,Ai2,Aik是A1,A2,An中的一部分,则A称为属性列或属性组。 tA=(tAi1,tAi2,tAik)表示元组t在属性列A上诸分量的集合。 则表示A1,A2,An中去掉Ai1,Ai2,Aik后剩余的属性组。 (3) :R为n目关系,S为m目关系。 trR,tsS,称为元组的连接。是一个n + m列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。 (4)象集Zx: 给定一个关系R(X,Z),X和Z为属性组。 当tX=x时,x在R中的象集(Image
38、s Set)为: Zx=tZ|tR,tX=x 它表示R中属性组X上值为x的诸元组在Z上分量的集合 1. 选择(Selection)1) 选择又称为限制(Restriction)2) 选择运算符的含义在关系R中选择满足给定条件的诸元组 F(R) = t|tRF(t)= 真F:选择条件,是一个逻辑表达式,基本形式为: X1Y13) 选择运算是从关系R中选取使逻辑表达式F为真的元组,是从行的角度进行的运算在关系代数运算中我们规定,凡是涉及到与空值null的比较,其结果都是false。 2. 投影(Projection) 1)投影运算符的含义:从R中选择出若干属性列组成新的关系 (R) = tA |
39、tR A:R中的属性列2)投影操作主要是从列的角度进行运算但投影之后不仅取消了原关系中的某些列,而且还可能取消某些元组(避免重复行)3. 连接(Join) 4)一般的连接操作是从行的角度进行运算。自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。 外连接:如果把舍弃的元组也保存在结果关系中,而在其他属性上填空值(Null),这种连接就叫做外连接(OUTER JOIN)。左外连接:如果只把左边关系R中要舍弃的元组保留就叫做左外连接(LEFT OUTER JOIN或LEFT JOIN)右外连接:如果只把右边关系S中要舍弃的元组保留就叫做右外连接(RIGHT OUTER JOIN或RIGH
40、T JOIN)。 4. 除(Division) 2)除操作是同时从行和列角度进行运算除运算用符号表示,适合于包含诸如对所有的此类短语的查询。 设关系R的属性集为X,Y,S的属性集为Y,Z,则RS的结果是一个关系P,P的属性集为X,并且PS包含在R中RS的计算方法T X (R)W(T Y(S) )RV X (W)RSTV数据库系统原理An Introduction to Database System关系数据库标准语言SQLSQL(Structured Query Language)结构化查询语言,是关系数据库的标准语言SQL是一个通用的、功能极强的关系数据库语言SQL/86:ANSI 跟 IS
41、O的第一个标准; SQL/92(aka SQL2):被数据库管理系统(DBMS)生产商广泛接受; 1970: E.F. Codd 发表了关系数据库理论(relational database theory);SQL的特点-1.综合统一:(1)集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体。(2)可以独立完成数据库生命周期中的全部活动: 定义关系模式,插入数据,建立数据库; 对数据库中的数据进行查询和更新; 数据库重构和维护 数据库安全性、完整性控制等(3)用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据的运行。(4)数据操作符统一2.高度非过程化
42、:非关系数据模型的数据操纵语言“面向过程”,必须制定存取路径SQL只要提出“做什么”,无须了解存取路径。存取路径的选择以及SQL的操作过程由系统自动完成。3.面向集合的操作方式非关系数据模型采用面向记录的操作方式,操作对象是一条记录SQL采用集合操作方式 操作对象、查找结果可以是元组的集合 一次插入、删除、更新操作的对象可以是元组的集合4.以同一种语法结构提供多种使用方式SQL是独立的语言:能够独立地用于联机交互的使用方式SQL又是嵌入式语言:SQL能够嵌入到高级语言(例如C,C+,Java)程序中,供程序员设计程序时使用5.语言简洁,易学易用SQL功能极强,完成核心功能只用了9个动词。SQL
43、的基本概念基本表:u 本身独立存在的表u SQL中一个关系就对应一个基本表u 一个(或多个)基本表对应一个存储文件u 一个表可以带若干索引存储文件:u 逻辑结构组成了关系数据库的内模式u 物理结构是任意的,对用户透明视图:u 从一个或几个基本表导出的表u 数据库中只存放视图的定义而不存放视图对应的数据u 视图是一个虚表u 用户可以在视图上再定义视图学生表:Student(Sno,Sname,Ssex,Sage,Sdept)课程表:Course(Cno,Cname,Cpno,Ccredit)学生选课表:SC(Sno,Cno,Grade)SQL的数据定义功能: 模式定义、表定义、视图和索引的定义模
44、式一、定义模式定义模式实际上定义了一个命名空间在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句。 CREATE SCHEMA AUTHORIZATION | 方括号中可不写,括号在写时不需要加括号如果没有指定,那么隐含为例1定义一个学生-课程模式S-T CREATE SCHEMA “S-T” AUTHORIZATION WANG;二、删除模式DROP SCHEMA CASCADE(级联) 删除模式的同时把该模式中所有的数据库对象全部删除RESTRICT(限制) 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。 当该模式中没有任何下属的对象时才能执行。例4 DROP SCHEMA ZHANG CASCADE; 删除模式ZHANG 同时该模式中定义的表TAB1也被删除基本表一、定义基本表CREATE TABLE ( , , ); 如果完整性约束条件涉及到该表的多个属性列,则必须定义在表级上,否则既可以定义在列级也可以定义在表级。 例5 建立“学生