《第2章 关系数据库系统.ppt》由会员分享,可在线阅读,更多相关《第2章 关系数据库系统.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章关系数据库系统关系数据库系统2.1概述概述2.1.1 关系数据库系统 关系数据库是以关系模型为基础的数据库管理系统。它具有简单灵活的数据模型、较高的数据独立性、能提供良好性能的接口并有坚实的数学理论基础等优点,是目前广泛使用的数据库系统。2.1.2 关系数据模型关系数据模型是由关系数据结构关系数据结构、关系操作集合关系操作集合和关关系的完整性约束系的完整性约束三大要素组成。1.关系数据结构在关系数据模型中,采用单一的数据结构关系关系。现实世界的实体及实体间的各种联系均用关系来表示。在用户看来,关系就是一个二维表二维表。2.关系操作集合在关系数据模型中,常用的关系操作一般分为两部分(
2、1)与数据查询数据查询有关的操作,包括选择、投影、连接、选择、投影、连接、除、并、交、差除、并、交、差 等;(2)与数据更新数据更新有关的操作,包括插入插入、删除删除、修改修改等。其中查询的表达能力查询的表达能力是其中最主要的部分。关系操作的特点特点是面向集合面向集合的操作方式,即操作的对象操作的对象和结果和结果都是集合集合。而非关系数据模型的数据操作是面向记录的操作方式,即每次操作的对象和结果都是一个记录。关系数据库语言通常分为三类:关系代数语言关系代数语言:使用关系运算来表示各种查询操作。关系演算语言关系演算语言:使用数理逻辑中的谓词演算来表示各种查询结果。关系演算按谓词变元的基本对象是元
3、组还是域变量又分为元组关系演算语言和域关系演算语言。结构化查询语言结构化查询语言SQL:一种介于关系代数和关系演算之间的语言。3.关系的完整性约束关系模型的完整性通常由一组完整性规则一组完整性规则来定义,关系模型的完整性规则实际上是对关系的某种约束对关系的某种约束条件条件。关系模型中通常可分为三类完整性约束,即实体完整性实体完整性、参照完整性参照完整性和用户定义的完整性用户定义的完整性。2.2关系数据模型的数据结构关系数据模型的数据结构2.2.1关系数据模型的数据结构及有关术语现实世界的实体及实体间的各种联系均用关系关系来表示。在用户看来,关系就是一个二维表。如:学号姓名性别年龄所在系籍贯20
4、020001 张刚男20计算机北京20020002 王小明 男18自动化天津20020003 李莉女19计算机河北20020004 赵华男18计算机天津学生1.关系关系一个关系对应一个二维表,每个表必须有一个表名,称为关系名。2.属性和域属性和域表中的每一列(或字段),称为属性。对表中每个属性必须起一个名字,即属性名。属性列中的值称为属性值,属性值的取值范围称为域。3.关系模式关系模式对关系的描述称为关系模式。一般表示为:关系名(属性1,属性2,属性n)如上例中关系模式为:学生(学号,姓名,性别,年龄,所在系,籍贯)实际上关系模式是指对表结构的定义和描述,包括表名及表中有哪些属性列、各个属性的
5、名、数据类型和宽度等。4.元组和分量关系中的一行,称为一个元组。元组中的每一个属性值,称为该元组的一个分量。5.侯选码和主码在一个关系中,如果存在某个属性可以唯一标识该关系的元组,这个属性称为该关系的侯选码。若一个关系中有多个侯选码,则选定其中一个为主码。6.主属性和非主属性一个关系中所有侯选码中的诸属性称为主属性,不包含在任何侯选码中的属性称为非主属性。2.2.2关系的形式化定义关系的形式化定义从数学的观点定义关系称为关系的形式化定义。下面从集合论的角度给出关系形式化的定义。1.域一组具有相同数据类型的值的集合。2.笛卡儿积给定一组域D1、D2、Dn(这些域中也可以有相同的),则D1、D2、
6、Dn的笛卡尔积为:D1 D2 Dn=(d1、d2、dn)|diDi,i=1,2,n其中每一个元素(d1、d2、dn)称为一个n元组,简称元组。元素中的每一个值di叫做一个分量。若Di(i=1,2,n)为有限集,其基数为mi(i=1,2,n),则D1 D2 Dn的基数 n为:M=mi i=1例如:D1=教师集合=王刚,张华,李莉D2=课程集合=数学,英语D3=教室集合=101,102则D1 D2 Dn=(王刚,数学,101),(王刚,数学,102),(王刚,英语,101),(王刚,英语,102),(张华,数学,101),(张华,数学,102),(张华,英语,101),(张华,英语,102),(李
7、莉,数学,101),(李莉,数学,102),(李莉,英语,101),(李莉,英语,102)其中(王刚,数学,101)、(王刚,数学,102)等都是元组。王刚、数学、101等都是分量。该笛卡尔积的基数为322=12,即D1 D2 D3一共有12个元组,也可以用二维表表示,如图:教师课程教室王刚数学101王刚数学102王刚英语101王刚英语102张华数学101张华数学102张华英语101张华英语102李莉数学101李莉数学102李莉英语101李莉英语1023.关系D1 D2 Dn的一个子集称为在域D1、D2、Dn上的一个关系。例如,在上图的笛卡尔积中,根据授课的实际情况,选出其中的一个子集,如下图
8、所示,便构成了一个关系(该关系名为授课)授课教师课程教室王刚数学101张华数学101李莉英语102需指出的是:从数学角度所研究的关系理论中,一个关系中的元组个数可以是无限的,即无限关系。另外,由于笛卡尔积不满足交换率,因此,当关系作为关系数据模型的数据结构时,必须给予如下的限定和扩充:在关系模型中的关系必须是有限关系,因为计算机无法处理无限数据;通过为关系的每个列附加一个不同的属性名,用来标识关系中的诸列,从而可以取消关系元组中分量间的有序性,使关系中的属性列可以任意交换。2.2.3 关系的分类和性质 在关系数据库中,关系通常有三种类型,即基本关系(又称基本表和基表)、查询表和视图(表)。基本
9、表是数据库中实际存在的用来存储数据的表;查询表是用来临时存放查询结果的表;视图是由基本表和其他视图导出的表,它并不存放数据,因此是虚表。基本关系应具有以下基本关系应具有以下6条基本性质:条基本性质:列是同质的,即每一列中的分量是同一类型的数据,来自同一列是同质的,即每一列中的分量是同一类型的数据,来自同一个域;个域;不同的列可以出自同一个域,称其中的每一列为一个属性,不不同的列可以出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名;同的属性要给予不同的属性名;列的顺序无所谓,即列的次序可以任意交换;列的顺序无所谓,即列的次序可以任意交换;任意两个元组不能完全相同;任意两个元组
10、不能完全相同;行的顺序无所谓,即行的次序可以任意交换;行的顺序无所谓,即行的次序可以任意交换;每一个分量必须是不可分的数据项,即不允许表中有表。每一个分量必须是不可分的数据项,即不允许表中有表。职工表姓名应发工资扣除工资实发工资基本津贴公积金医保001张华100020020010990002王刚1200250220121018003李莉8001501808762工资表不满足关系性质的表不满足关系性质的表2.3 关系数据模型的完整性关系数据模型的完整性通常由一组完整性规则来定义,关系数据模型的完整性规则实际上是对关系的某种约束条件。关系数据模型中通常可分为三类完整性约束,即实体完整性、参照完整性
11、和用户定义的完整性。其中实体完整性和参照完整性是关系数据模型必须满足完整性约束条件,应由关系数据库管理系统自动支持,而用户定义的完整性是应用领域要遵守的约束条件,体现了具体领域中的语义约束,用户可利用关系数据库管理系统或开发工具提供的相应功能实现。【例2.1】设在学生信息数据库中,有如下四个关系:学生(学号,姓名,性别,年龄,所在系,籍贯,专业号)专业(专业号,专业名)课程(课程号,课程名,学分)选修(学号,课程号,成绩)其中用下划线标出的属性为关系的主码。其中用下划线标出的属性为关系的主码。2.3.1 实体完整性实体完整性规则是对关系中主属性的约束。实体完整性规则是:若属性A是基本关系R的主
12、属性,则属性A不能取空值。特别说明:实体完整性规则规定关系中所有主属性不能特别说明:实体完整性规则规定关系中所有主属性不能为空值,而不是主码不能为空值。为空值,而不是主码不能为空值。说明:说明:实体的完整性是针对基本关系而言的,一个基本表通常实体的完整性是针对基本关系而言的,一个基本表通常对应现实世界的一个实体集。对应现实世界的一个实体集。现实世界的实体是可以区分的,即它们具有某种唯一性现实世界的实体是可以区分的,即它们具有某种唯一性标志。标志。主属性不能取空值。主属性不能取空值。2.3.2 参照完整性现实世界中的实体之间往往存在某种联系,在关系模型中实体和实体间的联系都是通过关系来描述的,这
13、种联系在关系数据模型中通常反映在关系和关系之间存在着参照关系。【例2.2】设在学生信息数据库中,有学生和专业两个关系:学生(学号,姓名,性别,年龄,所在系,籍贯,专业号)专业(专业号,专业名)学生关系 专业关系专业号参照关系图参照关系图【例2.3】在学生信息数据库中,有学生、课程和选修三个关系:学生(学号,姓名,性别,年龄,所在系,籍贯,专业号)课程(课程号,课程名,学分)选修(学号,课程号,成绩)学生关系 选修关系 课程关系学号课程号参照关系图参照关系图参照完整性规则:若属性F是关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中的每一个元组在F上的值
14、必须为:或者取空值(或者取空值(F的每个属性值均为空);的每个属性值均为空);或者取或者取S中某个元组的主码值。中某个元组的主码值。2.3.3 用户定义的完整性用户定义的完整性是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。例如:某个属性必须取唯一值,某个属性的取值范围必须在0100之间,某些属性值之间应满足一定的函数关系等。2.4 关系代数关系代数是关系数据操纵语言的一种传统表达方式,它是以集合代数为基础发展起来的,其运算对象和运算结果均为关系。关系代数也是一种抽象的查询语言,它通过关系运算表达查询。关系代数运算有四类:集合、关系、比较和逻辑。其运算符分
15、别如下:集合运算符:(并)、(并)、(交)、(交)、-(差)、(差)、(广义笛卡尔积)(广义笛卡尔积)关系运算符:(选择)(选择)(选择)(选择)、(投影)、(投影)、(投影)、(投影)、(连接)、(连接)、(连接)、(连接)、(除)(除)(除)(除)。比较运算符:(小于)(小于)(大于)(大于)(小于等于)(小于等于)(大于等于)(大于等于)(等于)(等于)(不等于)(不等于)逻辑运算符:(与)、(与)、(或)、(或)、(非)非)。1并运算(union)假设有n元关系R和n元关系S,它们的相应属性取自同一个域,则它们的并仍然是一个n元关系,它由属于关系R或者属于关系S的元组组成,并记为:RS
16、2.4.1传统的集合运算传统的集合运算例:例:4.1例例4.2ABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1RsABCa1b1c1a1b2c2a2b2c1a1b3c2RS2差运算(difference)假设有n元关系R和n元关系S,它们的相应属性取自同一个域,则n元关系R和n元关系S的差仍然是一个n元关系,它由属于关系R而不属于关系S的元组组成。记为:RS例:例:4.3ABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1ABCa1b1c1例例4.4RSR-S交运算(intersection)假设有n元关系R和n元关系S,它们
17、的相应属性取自同一个域,则它们的交仍然是一个n元关系,它由属于关系R且又属于关系S的元组组成。记为:RS例:例:4.5ABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1ABCa1b2c2a2b2c1例例4.6RSRS广义笛卡尔积广义笛卡尔积 假设有m元关系R和n元关系S,则R与S的笛卡尔积记为RS,它是一个m+n元组的集合(即m+n元关系),其中每个元组的前m个分量是R的一个元组,后n个分量是S的一个元组。RS是所有具备这种条件的元组组成的集合。例:例:4.7ABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1R.AR.BR.C
18、S.AS.BS.Ca1b1C1a1b2c2a1b1C1a1b3c2a1b1C1a2b2c1a1b2c2a1b2c2a1b2c2a1b3c2a1b2c2a2b2c1a2b2c1a1b2c2a2b2c1a1b3c2a2b2c1a2b2c1例例4.8RSRS2.4.2专门的关系运算专门的关系运算 专门的关系运算包括选择、投影、连接、除等。为了叙述上的方便,先引入几个记号。(1)设关系模式为R(A1,A2,An)。它的一个关系设为R。tR表示t是R的一个元组。tAi则表示元组t中相应于属性Ai的一个分量。(2)若A=Ai1,Ai2,Aik,其中Ai1,Ai2,Aik是A1,A2,An中的一部分,则A称
19、为属性列或域列。tA=(tAi1,tAi2,tAik)表示元组t在属性列A上诸分量的集合。A则表示A1,A2,An中去掉Ai1,Ai2,Aik后剩余的属性组。(3)R为 n目关系,S为 m目关系。trR,tsS,trts 称为元组的连接(Concatenation)。它是一个 nm列的元组,前n个分量为R中的一个 n元组,后m个分量为S中的一个m元组。(4)给定一个关系R(X,Z),X和Z为属性组。定义,当tX=x时,x在 R中的象集(Images Set)为:Zx=tZ|t R,tX=x 它表示R中属性组X上值为x的诸元组在Z上分量的集合。5选择运算选择运算(selection)选择运算是在
20、指定的关系中选取所有满足给定条件的元组,构成一个新的子集。选择运算用公式表示为:g(R)=r|rRg(t)为真公式中的R是关系名,g为一个逻辑表达式,取值为真或为假。g由逻辑运算符(and)、(or)(or)、(not)和算术运算符、连接起来。其运算对象为常量、属性名或者是简单函数。为选择运算符。例:例:商品代码字公司代码品名数量 单价1Comp1练习本20010.002Comp1圆珠笔506.003Comp1练习本1000 3.004Comp1笔记本1000 8.005Comp2钢笔5010.006Comp2练习本2003.007Comp2信笺1000 3.00例:有下表关系例:有下表关系表
21、表2【例】由上表2所示关系(假设名称为营业库)如欲求公司中所有单价不少于5元的商品的情况(包括子公司代码,品名,数字和单价),求关系代数式。关系代数式为:单价5(营业库),结果下表所示。表 单价5(营业库)运算结果商品代码字公司代码品名数字单价1Comp1钢笔5010002Comp1圆珠笔2006004Comp1笔记本10008005Comp2钢笔5010006投影运算(projection)投影运算是在给定关系的某些域上进行的运算。通过投影运算可以从一个关系中选择出所需要的属性,并按要求排列成一个新的关系。经过投影运算,如果某些属性取消后,出现重复元组,那么必须删除重复的元组。投影运算用公式
22、表示为:A(R)=tA|t R A:R中的属性列中的属性列例:例:【例】由表2所示“营业库”关系,欲求所有商品数量情况,要求取出品名和数量两列,求关系运算式及结果。关系运算式为:品名,数量(营业库)也可将列名用顺序号表示,上式可写为3,4(营业库),结果如表7所示。表7 品名,数量(营业库)运算结果品名数量钢笔50圆珠笔200练习本1000笔记本1000练习本200信笺1000在投影后如出现重复元组,应只保留一个。在投影后如出现重复元组,应只保留一个。【例】求“营业库”所示的所有公司销售商品的品名清单。关系运算式:品名(营业库),结果如表8所示。表8 品名(营业库)运算结果品名钢笔圆珠笔练习本
23、笔记本信笺实际查询问题一般既要通过选择操作又要通过投影操作求解。实际查询问题一般既要通过选择操作又要通过投影操作求解。【例】求“营业库”中所有单价大于5元的商品品名和单价,求关系运算式。关系运算式:品名,单价(单价5(营业库),其结果见表9。表9 从表46再作投影品名单价钢笔1000圆珠笔600笔记本8007联接运算(联接运算(join)连连接也称接也称为为连连接。它是从两个关系的笛卡接。它是从两个关系的笛卡尔尔积积中中选选取取属性属性间满间满足一定条件的元足一定条件的元组组。记记作:作:其中A和B分别为R和S上度数相等且可比的属性组。是比较运算符。连接运算从R和 S的广义笛卡尔积R|S中选取
24、(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equal-join),一种是自然连接(Natural-join)。为“=”的连接运算称为等值连接。它是从关系R与S的广义笛卡尔积中选取A,B属性值相等的那些元组,即等值连接为:自然连接(Natural-join)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉。即若R和S具有相同的属性组B,则自然连接可记作:一般的连接操作是从行的角度进行运算。但自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。例 设
25、图 5(a)和(b)分别为关系R和关系 S,图5(c)为 的结果,图5(d)为等值连接的结果。图5(e)为自然连接R|S结果。ABC例:例:8自然联接运算(Natural join)自然联接运算是对两个具有公共属性的关系所进行的运算。设关系R和关系S具有公共的属性,则关系R和关系S的自然连接的结果,是从它们的笛卡尔积RS中选出的公共属性值相等的那些元组,并去掉重复的属性。记为:R S 例:例:综合举例设有一个学生设有一个学生-课程数据库,包括学生关系课程数据库,包括学生关系Student、课程关系课程关系Course和选修关系和选修关系SC。例例1查询信息系(查询信息系(IS系)全体学生系)全
26、体学生 Sdept=IS(Student)或 5=IS(Student)其中下角标“5”为 Sdept的属性序号。结果如图3(a)所示 例例2查询年龄小于查询年龄小于20岁的学生岁的学生 Sage20(Student)或 420(Student)结果如图3(b)所示。图图3(a)图图3(b)例例3查询学生的姓名和所在系,即求查询学生的姓名和所在系,即求Student关系在学生关系在学生姓名和所在系两个属性上的投影。姓名和所在系两个属性上的投影。Sname,Sdept(Student)或 2,5(Student)结果如图4(a)。例例4查询学生关系查询学生关系Student中都有哪些系,即查询关
27、系中都有哪些系,即查询关系Student在所在系属性上的投影。结果如图在所在系属性上的投影。结果如图4(b)Sdept(Student)图图4(a)图图4(b)Sname,(Cpno=5(Course)|SC|Sno,Sname(Student)或Sname,(Sno(Cpno=5(Course)|SC)|Sno,Sname(Student)例例5查询选修了查询选修了2号课程的学生的学号。号课程的学生的学号。Sno(no=2(SC)=95001,95002 例例6查询至少选修了一门其直接先行课为查询至少选修了一门其直接先行课为5号课程的学生姓名。号课程的学生姓名。查询年龄小于查询年龄小于20岁
28、学生的姓名岁学生的姓名Sname,(sage=90(student|SC|course)或Sname(student|grade=90(SC)|Cname=数据库(course)例例对对“学生选课学生选课”关系模型:关系模型:S(SNO,SNAME,SEX)、C(CNO,CNAME,CREDIT)、SC(SNO,CNO,SCORE),用,用关系代数表达式表示以下查询,并写出相应的关系代数表达式表示以下查询,并写出相应的Transtact-SQL语句。语句。选修了课程编号为选修了课程编号为c001的课程的学生的学号。的课程的学生的学号。关系代数表达式:关系代数表达式:SNO(CNO=c001(S
29、C)没有选修编号没有选修编号c001的课程的学生的学号。的课程的学生的学号。关系代数表达式:关系代数表达式:SNO(S)-SNO(CNO=c001(SC)注意不能写为注意不能写为SNO(CNOc001(SC)选修了数据库应用课程的学生的学号。选修了数据库应用课程的学生的学号。关系代数表达式:关系代数表达式:SNO(CNAME=数据库应用数据库应用(SCC)选修了数据库应用课程的学生的学号、姓名。选修了数据库应用课程的学生的学号、姓名。关系代数表达式:关系代数表达式:SNO,SNAME(CNAME=数据库应用数据库应用(SCC)S)至少选修了两门课程的学生的学号。至少选修了两门课程的学生的学号。
30、关系代数表达式:关系代数表达式:1(1=425(SCXSC)例例1查询学习课程号查询学习课程号1137的学生的学号和成绩。的学生的学号和成绩。Sno,Grade(Cno=1137(SC)例例2查询学习课程号为查询学习课程号为1137的学生的学号和姓名。的学生的学号和姓名。Sno,Sname(S (Cno=1137(SC)例例3查询选修课程名为查询选修课程名为“管理学管理学”的学生的学号和姓名。的学生的学号和姓名。Sno,Sname(S (Cname=管理学管理学(C)SC)例例4查询选修课程号为查询选修课程号为1024或或1136的学生的学号。的学生的学号。Sno(Cno=1024Cno=11
31、36(SC)例例5查询至少选修课程号为查询至少选修课程号为1024与与1136的学生的学号。的学生的学号。1(1=42=10245=1136(SCSC)在本例中在本例中SCSC表示关系表示关系SC自身进行笛卡尔积,结果中有列重名的现象,这自身进行笛卡尔积,结果中有列重名的现象,这时,不能写时,不能写Sno=Sno,因为,因为Sno具有二义性(有两个列的名称都叫具有二义性(有两个列的名称都叫Sno),所),所以用以用1=4来表示,来表示,1表示第表示第1列,列,4表示第表示第4列。列。作业及练习作业及练习设学生选课数据库中有设学生选课数据库中有3个关系:个关系:S(SNO,CLASS,SNAME,SEX)、C(CNO,CNAME,TNAME)、SC(SNO,CNO,SCORE),用关系代数表达式表示以下查询用关系代数表达式表示以下查询张三老师所授课程的课程编号、课程名。信息501班所有男学生的学号与姓名。学号为1003的学生所学课程的课程名和教师名。至少选修了张三老师所授课程中一门课程的女学生姓名。学生王五不学的课程的课程编号。同时选修了课程编号为c001及c002的学生学号和姓名。全部学生都选修的课程编号和课程名。选修了张三老师所授所有课程的学生学号。