《数据库系统第10讲课件.ppt》由会员分享,可在线阅读,更多相关《数据库系统第10讲课件.ppt(160页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据库系统第10讲课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第七章 数据库设计7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库实施与维护7.7小结27.1 数据库设计概述7.1.1数据库设计的特点7.1.2数据库设计方法7.1.3数据库设计的基本步骤7.1.4数据库设计过程中的各级模式3数据库设计概述(续)n什么是数据库设计q数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建
2、立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)q在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。47.1.1数据库设计的特点n数据库是信息系统的核心和基础q把信息系统中大量的数据按一定的模型组织起来q提供存储、维护、检索数据的功能q使信息系统可以方便、及时、准确地从数据库中获得所需的信息n数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在;n数据库设计是信息系统开发和建设的重要组成部分.5数据库设计人员应该具备的技术和知识n数据库的基本知识和数据库设计技术n计算机科学的基础知识和程序设计的方法和技巧n软件工程的原理和
3、方法n应用领域的知识67.1.1 数据库设计的特点n三分技术,七分管理,十二分基础数据n 数据库设计应该与应用系统设计相结合q结构(数据)设计:设计数据库框架或数据库结构q行为(处理)设计:设计应用程序、事务处理等77.1.3 数据库设计的基本步骤一、数据库设计的准备工作 首先选定参加设计的人员:1.数据库分析设计人员q数据库设计的核心人员q自始至终参与数据库设计q其水平决定了数据库系统的质量87.1.3 数据库设计的基本步骤2.用户q在数据库设计中也是举足轻重的q主要参加需求分析和数据库的运行维护q用户积极参与带来的好处n加速数据库设计n提高数据库设计的质量9数据库设计的基本步骤(续)3.程
4、序员q在系统实施阶段参与进来,负责编制程序4.操作员q在系统实施阶段参与进来,准备软硬件环境10数据库设计的基本步骤(续)二、数据库设计的过程(六个阶段)需求分析阶段 需求分析是整个数据库设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规格化和分析。这是最费时、最复杂的一步,但也是最重要的一步,相当于待构建的数据库大厦的地基,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。在分析用户需求时,要确保用户目标的一致性。11数据库设计的基本步骤(续)概念结构设计阶段 概念设计是把用户的信息要求统一到一个整体逻辑结构中,此结构能够表达用户的要求,是
5、一个独立于任何DBMS软件和硬件的概念模型。12数据库设计的基本步骤(续)逻辑结构设计阶段 逻辑设计是将上一步所得到的概念模型转换为某个DBMS所支持的数据模型,并对其进行优化。13数据库设计的基本步骤(续)数据库物理设计阶段q物理设计是为逻辑数据模型建立一个完整的能实现的数据库结构,包括存储结构和存取方法。14数据库设计的基本步骤(续)数据库实施阶段q运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果n建立数据库n编制与调试应用程序n组织数据入库n并进行试运行15数据库设计的基本步骤(续)数据库运行和维护阶段 这一阶段主要是收集和记录实际系统运行的数据,数据库运行的记录
6、用来提高用户要求的有效信息,用来评价数据库系统的性能,进一步调整和修改数据库。在运行中,必须保持数据库的完整性,并能有效地处理数据库故障和进行数据库恢复。在运行和维护阶段,可能要对数据库结构进行修改或扩充。16数据库设计的基本步骤(续)以上六个阶段是从数据库应用系统设计和开发的全过程来考察数据库设计的问题。因此,它既是数据库也是应用系统的设计过程。在设计过程中,努力使数据库设计和系统其他部分的设计紧密结合,把数据和处理的需求收集、分析、抽象、设计和实现在各个阶段同时进行、相互参照、相互补充,以完善两方面的设计。17n数据库各级模式的形成过程q需求分析阶段n 综合各个用户的应用需求q概念设计阶段
7、n 形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图)7.1.4 数据库设计过程中的各级模式18q逻辑设计阶段n首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式n然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式19q物理设计阶段n根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式207.2 需求分析7.2.1 需求分析的任务7.2.2 需求分析的方法7.2.3 数据字典21需求分析(续)n需求分析就是分析用户的需要与要求q需求分析是设计数据库的起点q需求分析的结果是否准确
8、地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用227.2 需求分析7.2.1 需求分析的任务7.2.2 需求分析的方法7.2.3 数据字典237.2.1 需求分析的任务一、需求分析的任务二、需求分析的重点三、需求分析的难点24一、需求分析的任务n 通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求n 在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库25二、需求分析的重点n需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、
9、处理要求、安全性与完整性要求。n 信息要求q用户需要从数据库中获得信息的内容与性质q由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据26需求分析的重点(续)n处理要求q对处理功能的要求q对处理的响应时间的要求q对处理方式的要求(批处理/联机处理)n新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。27三、需求分析的难点n确定用户最终需求的难点q用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。q设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。q新的
10、硬件、软件技术的出现也会使用户需求发生变化。28需求分析的难点(续)n解决方法q设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求297.2 需求分析7.2.1 需求分析的任务7.2.2 需求分析的方法7.2.3 数据字典307.2.2 需求分析的方法n调查清楚用户的实际需求并进行初步分析n 与用户达成共识n 进一步分析与表达这些需求31一、调查与初步分析用户需求 调查组织机构情况q 组织部门的组成情况q 各部门的职责等32调查与初步分析用户需求(续)调查各部门的业务活动情况。调查重点之一。q 各个部门输入和使用什么数据q 如何加工处理这些数据q 输出什么信息
11、q 输出到什么部门q 输出结果的格式是什么33调查与初步分析用户需求(续)在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。q 信息要求q 处理要求q 完全性与完整性要求34调查与初步分析用户需求(续)对前面调查的结果进行初步分析q确定新系统的边界n确定哪些功能由计算机完成或将来准备让计算机完成n确定哪些活动由人工完成 由计算机完成的功能就是新系统应该实现的功能。35二、常用调查方法n做需求调查时,往往需要同时采用多种方法q无论使用何种调查方法,都必须有用户的积极参与和配合q设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最
12、后结果共同承担责任36常用调查方法(续)n常用调查方法跟班作业q通过亲身参加业务工作了解业务活动的情况q能比较准确地理解用户的需求,但比较耗时开调查会q通过与用户座谈来了解业务活动情况及用户需求请专人介绍37常用调查方法(续)询问q对某些调查中的问题,可以找专人询问设计调查表请用户填写q如果调查表设计合理,则很有效,且易于为用户接受查阅记录q查阅与原系统有关的数据记录38三、进一步分析和表达用户需求n分析和表达用户的需求的常用方法q自顶向下的结构化分析方法(Structured Analysis,简称SA方法)nSA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据
13、字典描述系统。39进一步分析和表达用户需求(续)1首先把任何一个系统都抽象为:数据流数据流数据流数据流数据数据存储存储信息要求信息要求数据数据来源来源处理处理数据数据输出输出处理要求处理要求40进一步分析和表达用户需求(续)2分解处理功能和数据(1)分解处理功能n将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。(2)分解数据n在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图n 数据流图表达了数据和处理过程的关系41进一步分析和表达用户需求(续)(3)表达方法n 处理过程:用判定表或判定树来描述n 数据:用数据字典来描述 4
14、2进一步分析和表达用户需求(续)3将分析结果再次提交给用户,征得用户的认可43四、需求分析小结44需求分析小结(续)实例:假设我们要开发一个学校管理系统。1经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。2进一步细化各个子系统。其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。454647484950517.2 需求分析7.2
15、.1 需求分析的任务7.2.2 需求分析的方法7.2.3 数据字典527.2.3 数据字典一、数据字典的用途二、数据字典的内容53一、数据字典的用途n数据字典是各类数据描述的集合n数据字典是进行详细的数据收集和数据分析所获得的主要结果n数据字典在数据库设计中占有很重要的地位54二、数据字典的内容n数据字典的内容q数据项q数据结构q数据流q数据存储q处理过程n 数据项是数据的最小组成单位n 若干个数据项可以组成一个数据结构n 数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。55 数据项n数据项是不可再分的数据单位n 对数据项的描述数据项描述数据项名,数据项含义说明,别名,数
16、据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系q取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件56 数据结构n数据结构反映了数据之间的组合关系。n 一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。n 对数据结构的描述数据结构描述数据结构名,含义说明,组成:数据项或数据结构57 数据流n 数据流是数据结构在系统内传输的路径。n 对数据流的描述数据流描述数据流名,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量q数据流来源是说明该数据流来自哪个过程q数据流去向是说明该数据流将到哪个过程去q平均流量是指在单位
17、时间(每天、每周、每月等)里的传输次数q高峰期流量则是指在高峰时期的数据流量58 数据存储n数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。n对数据存储的描述数据存储描述数据存储名,说明,编号,流入的数据流,流出的数据流,组成:数据结构,数据量,存取方式q流入的数据流:指出数据来源q流出的数据流:指出数据去向q数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息q存取方法:批处理/联机处理;检索/更新;顺序检索/随机检索59 处理过程n处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息n处理过程说明性信息的描述处理过程描述处理
18、过程名,说明,输入:数据流,输出:数据流,处理:简要说明60处理过程(续)q简要说明:主要说明该处理过程的功能及处理要求n功能:该处理过程用来做什么n处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等n处理要求是后面物理设计的输入及性能评价的标准61处理过程(续)例:学生学籍管理子系统的数据字典。数据项,以“学号”为例:数据项:学号 含义说明:唯一标识每个学生别名:学生编号 类型:字符型 长度:8 取值范围:00000000至99999999取值含义:前两位标别该学生所在年级,后六位按顺序编号与其他数据项的逻辑关系:62处理过程(续)数据结构 以“学生”为例“学生”
19、是该系统中的一个核心数据结构:数据结构:学生 含义说明:是学籍管理子系统的主体数据结 构,定义了一个学生的有关信息 组成:学号,姓名,性别,年龄,所在系,年级63处理过程(续)数据流“体检结果”可如下描述:数据流:体检结果 说明:学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成:平均流量:高峰期流量:64处理过程(续)数据存储“学生登记表”可如下描述:数据存储:学生登记表 说明:记录学生的基本情况流入数据流:流出数据流:组成:数据量:每年3000张 存取方式:随机存取 65处理过程(续)处理过程“分配宿舍”可如下描述:处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生
20、,宿舍,输出:宿舍安排处理:在新生报到后,为所有新生分配学 生宿舍。要求同一间宿舍只能安排 同一性别的学生,同一个学生只能 安排在一个宿舍中。每个学生的居 住面积不小于3平方米。安排新生 宿舍其处理时间应不超过15分钟。667.3 概念结构设计7.3.1 概念结构设计概述7.3.2 概念结构设计的方法与步骤7.3.3 数据抽象与局部视图设计7.3.4 视图的集成677.3.1 概念结构n什么是概念结构设计q需求分析阶段描述的用户应用需求是现实世界的具体需求。q将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。q概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更
21、抽象,从而更加稳定。q概念结构设计是整个数据库设计的关键。68概念结构(续)现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构设计概念结构设计69概念结构(续)n概念结构设计的特点(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。70概念结构(续)n概念结构设计的特点(续)(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。(4)易于向关系、网状、层次等各种数据模型转换。71概念结构(续)n描
22、述概念模型的工具qE-R模型nE-R图基本成分包含实体型、属性和联系。实体型:用矩形框表示,框内标注实体名称。属性:用椭圆形框表示,框内标注属性名称。联系:指实体之间的联系,有一对一(1:1),一对多(1:n)或多对多(m:n)三种联系类型。72学生选修学号(a)实体(b)属性(c)联系73两个实体型之间的联系有如下三种类型:(1)一对一联系(1:1)n实体集A中的一个实体至多与实体集B中的一个实体相对应,反之亦然,则称实体集A与实体集B为一对一的联系。记作1:1。q如:班级与班长,观众与座位,病人与床位。(2)一对多联系(1:n)n实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体
23、集B中的一个实体至多与实体集A中的一个实体相对应。记作1:n。q如:班级与学生、公司与职员、省与市。(3)多对多(m:n)n实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体与实体集A中的多个实体相对应。记作(m:n)。q如:教师与学生,学生与课程,工厂与产品。74(a)两个实体之间的联系学生选修成绩课程系主任领导系学生属于系11n1mn(c)实体集内部的联系职工领导1n供应商供应数量零件项目mnn(b)多个实体之间的联系75nE-R图的基本思想就是分别用矩形框、椭圆形框和菱形框表示实体、属性和联系,使用无向边将属性与其相应的实体连接起来,并将联系分别和有关实体相连接
24、,注明联系类型。76学生与课程联系的完整的ER图课程名学生学号姓名性别年龄系别课程课程号学分n选修成绩m77(2)数据抽象n在系统需求分析阶段,最后得到了多层数据流图、数据字典和系统分析报告。建立局部E-R模型,就是根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点,让这组图中毎一部分对应一个局部应用。在前面选好的某一层次的数据流图中,每个局部应用都对应了一组数据流图,局部应用所涉及的数据存储在数据字典中。现在就是要将这些数据从数据字典中抽取出来,参照数据流图,确定每个局部应用包含哪些实体,这些实体又包含哪些属性,以及实体之间的联系及其类型。78n设计
25、局部E-R模型的关键就是正确划分实体和属性。实体和属性之间在形式上并无可以明显区分的界限,通常是按照现实世界中事物的自然划分来定义实体和属性,将现实世界中的事物进行数据抽象,得到实体和属性。n一般有两种数据抽象:分类和聚集。79分类(Classification)q分类定义某一类概念作为现实世界中一组对象的类型,将一组具有某些共同特性和行为的对象抽象为一个实体。对象和实体之间是“is member of”的关系。q例如,在教学管理中,“赵兰”是一名学生,表示“赵兰”是学生中的一员,她具有学生们共同的特性和行为。80聚集(Aggregation)q聚集定义某一类型的组成成份,将对象类型的组成成份
26、抽象为实体的属性。组成成份与对象类型之间是“is part of”的关系。q例如,学号、姓名、性别、年龄、系别等可以抽象为学生实体的属性,其中学号是标识学生实体的主键。81(2)局部E-R模型设计n数据抽象后得到了实体和属性,实际上实体和属性是相对而言的,往往要根据实际情况进行必要的调整。在调整中要遵循两条原则:实体具有描述信息,而属性没有。即属性必须是不可分的数据项,不能再由另一些属性组成。属性不能与其他实体具有联系,联系只能发生在实体之间。q例如:学生是一个实体,学号、姓名、性别、年龄、系别等是学生实体的属性,系别只表示学生属于哪个系,不涉及系的具体情况,换句话说,没有需要进一步描述的特性
27、,即是不可分的数据项,则根据原则可以作为学生实体的属性。但如果考虑一个系的系主任、学生人数、教师人数、办公地点等,则系别应看作一个实体。82系别作为一个属性或实体学生学生系别属于n1m姓名性别年龄系别学号姓名性别年龄系主任学 生 人数教 师 人数办 公 地点83n又如,“职称”为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,即职称与住房实体之间有联系,则根据原则,职称应作为一个实体。84职称作为一个属性或实体聘任教师教师n1职称分配住房姓名性别职称姓名性别85n此外,可能会遇到这样的情况,同一数据项,可能由于环境和要求的不同,有时作为属性,有时则作为实体,此时必须根据实际情况而定。一
28、般情况下,凡能作为属性对待的,应尽量作为属性,以简化E-R图的处理。n下面举例说明局部E-R模型设计。n在简单的教务管理系统中,有如下语义约束。一个学生可选修多门课程,一门课程可为多个学生选修,因此学生和课程是多对多的联系;一个教师可讲授多门课程,一门课程可为多个教师讲授,因此教师和课程也是多对多的联系;一个系可有多个教师,一个教师只能属于一个系,因此系和教师是一对多的联系,同样系和学生也是一对多的联系。86n根据上述约定,可以得到如图所示的学生选课局部图和如图所示的教师任课局部图。形成局部E-R模型后,应该返回去征求用户意见,以求改进和完善,使之如实地反映现实世界。nE-R图的优点就是易于被
29、用户理解,便于交流。87学生选课局部图mmnm名称系拥有学生学号姓名性别年龄开课课程教师号课程号课程名选修成绩平均成绩88教师任课局部图1m教师号姓名性别职称课程号教师讲授课程n属于单位单位名电话m894全局E-R模型设计n局部E-R模型设计完成之后,下一步就是集成各局部E-R模型,形成全局E-R模型,即视图的集成。视图集成的方法有两种:多元集成法,一次性将多个局部E-R图合并为一个全局E-R图。二元集成法,首先集成两个重要的局部视图,以后用累加的方法逐步将一个新的视图集成进来。在实际应用中,可以根据系统复杂性选择这两种方案。一般采用逐步集成的方法,如果局部视图比较简单,可以采用多元集成法。一
30、般情况下,采用二元集成法,即每次只综合两个视图,这样可降低难度。无论使用哪一种方法,视图集成均分成两个步骤。90合并,消除各局部E-R图之间的冲突,生成初步E-R图。优化,消除不必要的冗余,生成基本E-R图。91局部视图合并成全局视图(a)多元集成法局部ER图1局部ER图2局部ER图n初步ER图基本ER图局部ER图1局部ER图2合并ER图12局部ER图3初步ER图基本ER图(b)二元集成法92视图集成局部图合并(消除冲突)修改与重构(消除不必要的冗余)集成视图基本图初步图分析规 范 化 理论93(1)合并局部E-R图,生成初步E-R图n这个步骤将所有的局部E-R图综合成全局概念结构。n全局概念
31、结构它不仅要支持所有的局部E-R模型,而且必须合理地表示一个完整、一致的数据库概念结构。n由于各个局部应用不同,通常由不同的设计人员进行局部E-R图设计,因此,各局部E-R图不可避免地会有许多不一致的的地方,我们称之为冲突。94n合并局部E-R图时并不能简单地将各个E-R图画到一起,而必须消除各个局部E-R图中的不一致,使合并后的全局概念结构不仅支持所有的局部E-R模型,而且必须是一个能为全系统中所有用户共同理解和接受的完整的概念模型。n合并局部E-R图的关键就是合理消除各局部E-R图中的冲突。95nE-R图中的冲突有三种:属性冲突、命名冲突和结构冲突。属性冲突n属性冲突又分为属性值域冲突和属
32、性的取值单位冲突。a.属性值域冲突,即属性值的类型、取值范围或取值集合不同。比如学号,有些部门将其定义为数值型,而有些部门将其定义为字符型。又如年龄,有的可能用出生年月表示,有的则用整数表示。b.属性的取值单位冲突。比如零件的重量,有的以公斤为单位,有的以斤为单位,有的则以克为单位。n属性冲突属于用户业务上的约定,必须与用户协商后解决。96命名冲突n命名不一致可能发生在实体名、属性名或联系名之间,其中属性的命名冲突更为常见。n一般表现为同名异义或异名同义(实体、属性、联系名)。a.同名异义,即同一名字的对象在不同的部门中具有不同的意义。比如,“单位”在某些部门表示为人员所在的部门,而在某些部门
33、可能表示物品的重量、长度等属性。b.异名同义,即同一意义的对象在不同的部门中具有不同的名称。比如,对于“房间”这个名称,在教务管理部门中对应着为教室,而在后勤管理部门对应为学生宿舍。n命名冲突的解决方法同属性冲突,需要与各部门协商、讨论后加以解决。97结构冲突a.同一对象在不同应用中有不同的抽象,可能为实体,也可能为属性。例如,教师的职称在某一局部应用中被当作实体,而在另一局部应用中被当作属性。这类冲突在解决时,就是使同一对象在不同应用中具有相同的抽象,或把实体转换为属性,或把属性转换为实体。b.同一实体在不同应用中属性组成不同,可能是属性个数或属性次序不同。解决办法是,合并后实体的属性组成为
34、各局部E-R图中的同名实体属性的并集,然后再适当调整属性的次序。c.同一联系在不同应用中呈现不同的类型。比如E1与E2在某一应用中可能是一对一联系,而在另一应用中可能是一对多或多对多联系,也可能是在E1、E2、E3三者之间有联系。这种情况应该根据应用的语义对实体联系的类型进行综合或调整。98n下面以教务管理系统中的两个局部E-R图为例,来说明如何消除各局部E-R图之间的冲突,进行局部E-R模型的合并,从而生成初步E-R图。q首先,这两个局部E-R图中存在着命名冲突,学生选课局部图中的实体“系”与教师任课局部图中的实体“单位”,都是指“系”,即所谓的异名同义,合并后统一改为“系”,这样属性“名称
35、”和“单位名”即可统一为“系名”。q其次,还存在着结构冲突,实体“系”和实体“课程”在两个不同应用中的属性组成不同,合并后这两个实体的属性组成为原来局部E-R图中的同名实体属性的并集。解决上述冲突后,合并两个局部E-R图,生成如图所示的初步的全局E-R图。99教务管理系统的初步ER图mn1系属于教师拥有学生开课讲授选修课程mmnm1m1学号姓名性别年龄平均成绩成绩教师号课程号课程名教 师号 姓名性别职称系名电话100(2)消除不必要的冗余,生成基本E-R图n所谓冗余,在这里指冗余的数据和实体之间冗余的联系。冗余的数据是指可由基本的数据导出的数据,冗余的联系是由其他的联系导出的联系。在上面消除冲
36、突合并后得到的初步ER图中,可能存在冗余的数据或冗余的联系。冗余的存在容易破坏数据库的完整性,给数据库的维护增加困难,应该消除。我们把消除了冗余的初步E-R图称为基本E-R图。n通常采用分析的方法消除冗余。数据字典是分析冗余数据的依据,还可以通过数据流图分析出冗余的联系。101n如在上图所示的初步E-R图中,“课程”实体中的属性“教师号”可由“讲授”这个教师与课程之间的联系导出,而学生的平均成绩可由“选修”联系中的属性“成绩”中计算出来,所以“课程”实体中的“教师号”与“学生”实体中的“平均成绩”均属于冗余数据。102n另外,“系”和“课程”之间的联系“开课”,可以由“系”和“教师”之间的“属
37、于”联系与“教师”和“课程”之间的“讲授”联系推导出来,所以“开课”属于冗余联系。n这样,初步E-R图在消除冗余数据和冗余联系后,便可得到基本的E-R模型,如图所示。n最终得到的基本E-R模型是企业的概念模型,它代表了用户的数据要求,是沟通“要求”和“设计”的桥梁。它决定数据库的总体逻辑结构,是成功建立数据库的关键。如果设计不好,就不能充分发挥数据库的功能,无法满足用户的处理要求。n因此,用户和数据库人员必须对这一模型反复讨论,在用户确认这一模型已正确无误的反映了他们的要求后,才能进入下一阶段的设计工作。103教务管理系统的基本ER图n1系属于教师拥有学生讲授选修课程mmnm1m学号姓名性别年
38、龄成绩课程号课程名教师号 姓名性别职称系名电话104举例n某医院病房计算机管理中需要如下信息:科室:科名,科地址,科电话,医生姓名病房:病房名,床位号,所属科室名医生:姓名,职称,所属科室名,年龄,工作证号病人:病历号,姓名,性别,诊断,主管医生,病历号 其中:一个科室有多个病房、多个医生,一个病房只能属于一个科室,一个医生只属于一个科室,但可以负责多个病人,一个病人的主管医生只有一个105科室医生病人病房隶属诊治组成住院科名科地址科电话病房名床位号病历号诊断性别姓名职称年龄工作证号姓名1m1m1m1m106逻辑结构设计的任务和步骤n概念结构设计阶段得到的E-R模型是用户的模型,它独立于任何一
39、种数据模型,独立于任何一个具体的DBMS。为了建立用户所要求的数据库,需要把上述概念模型转换为某个具体的DBMS所支持的数据模型。数据库逻辑设计的任务是将概念结构转换成特定DBMS所支持的数据模型的过程。从此开始便进入了“实现设计”阶段,需要考虑到具体的DBMS的性能、具体的数据模型特点。n从E-R图所表示的概念模型可以转换成任何一种具体的DBMS所支持的数据模型,如网状模型、层次模型和关系模型。这里只讨论关系数据库的逻辑设计问题,所以只介绍E-R图如何向关系模型进行转换。7.4 逻辑结构设计 107n一般的逻辑设计分为以下三步:q将概念结构转化为一般的关系、网状、层次模型q将转化来的关系、网
40、状、层次模型向特定DBMS支持下的数据模型转换q对数据模型进行优化108E-R图向关系模型的转换1转换原则n概念设计中得到的E-R图是由实体、属性和联系组成的,而关系数据库逻辑设计的结果是一组关系模式的集合。所以将E-R图转换为关系模型实际上就是将实体、属性和联系转换成关系模式。在转换中要遵循以下原则:(1)一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的键就是关系的键。(2)一个联系转换为一个关系模式,与该联系相连的各实体的键以及联系的属性均转换为该关系的属性。该关系的键有三种情况:109一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并;q1)转换为
41、一个独立的关系模式n n关系的属性关系的属性:与该联系相连的各实体的码以及联系本身的属性n n关系的候选码关系的候选码:每个实体的码均是该关系的候选码110q2)与某一端对应的关系模式合并n n合并后关系的属性合并后关系的属性:加入对应关系的码和联系本身的属性n n合并后关系的码合并后关系的码:不变111如果联系为1:n,可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。n1)转换为一个独立的关系模式qq关系的属性关系的属性:与该联系相连的各实体的码以及联系本身的属性qq关系的码关系的码:n端实体的码112q2)与n端对应的关系模式合并n n合并后关系的属性合并后关系的属性:在n端
42、关系中加入1端关系的码和联系本身的属性n n合并后关系的码合并后关系的码:不变q可以减少系统中的关系个数,一般情况下更倾向于采用这种方法113如果联系为n:m,则各实体键的组合是关系的键。qq关系的属性:与该联系相连的各实体的码以及联系本身的属性qq关系的码:各实体码的组合例,“选修”联系是一个m:n联系,可以将它转换为如下关系模式,其中学号与课程号为关系的组合码:选修(学号,课程号,成绩)1142具体做法(1)把每一个实体转换为一个关系n首先分析各实体的属性,从中确定其主键,然后分别用关系模式表示。例如,以下图的E-R模型为例,四个实体分别转换成四个关系模式:q 115教务管理系统的基本ER
43、图n1系属于教师拥有学生讲授选修课程mmnm1m学号姓名性别年龄成绩课程号课程名教师号 姓名性别职称系名电话116q学生(学号,姓名,性别,年龄)q课程(课程号,课程名)q教师(教师号,姓名,性别,职称)q系(系名,电话)n其中,有下划线者表示是主键。117(2)把每一个联系转换为关系模式n由联系转换得到的关系模式的属性集中,包含两个发生联系的实体中的主键以及联系本身的属性,其关系键的确定与联系的类型有关。n例如,还以教务管理系统的基本ER模型为例,四个联系也分别转换成四个关系模式:q属于(教师号,系名)q讲授(教师号,课程号)q选修(学号,课程号,成绩)q拥有(系名,学号)118(3)特殊情
44、况的处理n三个或三个以上实体间的一个多元联系在转换为一个关系模式时,与该多元联系相连的各实体的主键及联系本身的属性均转换成为关系的属性,转换后所得到的关系的主键为各实体键的组合。n例如,下图表示供应商、项目和零件三个实体之间的多对多联系,如果已知三个实体的主键分别为“供应商号”,“项目号”与“零件号”,则它们之间的联系“供应”可转换为关系模式,其中供应商号,项目号,零件号为此关系的组合关系键。q供应(供应商号,项目号,零件号,数量)119供应商供应数量零件项目mnn图 多个实体之间的联系120练习:n某医院病房计算机管理中需要如下信息:科室:科名,科地址,科电话,医生姓名病房:病房名,床位号,
45、所属科室名医生:姓名,职称,所属科室名,年龄,工作证号病人:病历号,姓名,性别,诊断,主管医生,病历号其中:一个科室有多个病房、多个医生,一个病房只能属于一个科室,一个医生只属于一个科室,但可以负责多个病人,一个病人的主管医生只有一个121科室医生病人病房隶属诊治组成住院科名科地址科电话病房名床位号病历号诊断性别姓名职称年龄工作证号姓名1m1m1m1m122n科室(科室名,科地址,科电话)n病房(病房号,床位号,科室名)n医生(工作证号,姓名,职称,科室名,年龄)n病人(病历号,姓名,性别,诊断,医生工作证号,病房号)123例例:某单位有一资料室,它管理的数据有:某单位有一资料室,它管理的数据
46、有读者信息、读者信息、图书信息、借阅信息图书信息、借阅信息。读者信息:读者信息:书证编号,姓名,性别,所在部门,职书证编号,姓名,性别,所在部门,职称,家庭住址,联系电话,办证日期称,家庭住址,联系电话,办证日期124图书信息:图书信息:书籍编号,书名,分类编号,作者姓书籍编号,书名,分类编号,作者姓名,出版社名称,出版日期,书籍页数,登记日名,出版社名称,出版日期,书籍页数,登记日期等;期等;借阅信息:借阅信息:书证编号,图书编号,借出日期,还书证编号,图书编号,借出日期,还书日期等书日期等L125读者读者图书图书借阅借阅书证编号书证编号姓名姓名书籍编号书籍编号书名书名借书日期借书日期还书日
47、期还书日期126关系模式规范化n应用规范化理论对上述产生的关系的逻辑模式进行初步优化,以减少乃至消除关系模式中存在的各种异常,改善完整性、一致性和存储效率。n规范化理论是数据库逻辑设计的指南和工具,规范化过程可分为两个步骤:确定规范式级别,实施规范化处理。1确定范式级别q考查关系模式的函数依赖关系,确定范式等级,逐一分析各关系模式,考查是否存在部分函数依赖,传递函数依赖等,确定它们分别属于第几范式。2实施规范化处理q确定范式级别后,利用规范化理论,逐一考察各个关系模式,根据应用要求,判断它们是否满足规范要求,可用已经介绍过的规范化方法和理论将关系模式规范化。127n综合以上数据库的设计过程,规
48、范化理论在数据库设计中有如下几方面的应用:(1)在需求分析阶段,用数据依赖概念分析和表示各个数据项之间的联系。(2)在概念结构设计阶段,以规范化理论为指导,确定关系键,消除初步E-R图中冗余的联系。(3)在逻辑结构设计阶段,从E-R图向数据模型转换过程中,用模式合并与分解方法达到规范化级别。128模式评价与改进1模式评价n关系模式的规范化不是目的而是手段,数据库设计的目的是最终满足应用需求。因此,为了进一步提高数据库应用系统的性能,还应该对规范化后产生的关系模式进行评价、改进,经过反复多次的尝试和比较,最后得到优化的关系模式。n模式评价的目的是检查所设计的数据库模式是否满足用户的功能要求、效率
49、,确定加以改进的部分。模式评价包括功能评价和性能评价。129n(1)功能评价q功能评价指对照需求分析的结果,检查规范化后的关系模式集合是否支持用户所有的应用要求。关系模式必须包括用户可能访问的所有属性。在涉及多个关系模式的应用中,应确保联接后不丢失信息。如果发现有的应用不被支持,或不完全被支持,则应该改进关系模式。发生这种问题的原因可能是在逻辑设计阶段,也可能是在需求分析或概念设计阶段。是哪个阶段的问题就返回到哪个阶段去,因此有可能对前两个阶段再进行评审,解决存在的问题。130(2)性能评价n对于目前得到的数据库模式,由于缺乏物理设计所提供的数量测量标准和相应的评价手段,所以性能评价是比较困难
50、的,只能对实际性能进行估计,包括逻辑记录的存取数、传送量以及物理设计算法的模型等。1312模式改进n根据模式评价的结果,对已生成的模式进行改进。q如果因为需求分析、概念设计的疏漏导致某些应用不能得到支持,则应该增加新的关系模式或属性。q如果因为性能考虑而要求改进,则可采用合并或分解的方法。(1)合并n如果有若干个关系模式具有相同的主键,并且对这些关系模式的处理主要是查询操作,而且经常是多关系的查询,那么可对这些关系模式按照组合使用频率进行合并。n这样便可以减少联接操作而提高查询效率。132(2)分解n为了提高数据操作的效率和存储空间的利用率,最常用和最重要的模式优化方法就是分解,根据应用的不同