数据库技术课件Chapter7数据库设计.pptx

上传人:蓝**** 文档编号:93475764 上传时间:2023-07-07 格式:PPTX 页数:173 大小:952.30KB
返回 下载 相关 举报
数据库技术课件Chapter7数据库设计.pptx_第1页
第1页 / 共173页
数据库技术课件Chapter7数据库设计.pptx_第2页
第2页 / 共173页
点击查看更多>>
资源描述

《数据库技术课件Chapter7数据库设计.pptx》由会员分享,可在线阅读,更多相关《数据库技术课件Chapter7数据库设计.pptx(173页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据库原理Principle of Database Systems第七章 数据库设计刘洁2第七章第七章 数据库设计数据库设计7.1 数据库设计概述7.2 需求分析7.3 概念结构设计7.4 逻辑结构设计7.5 数据库的物理设计7.6 数据库的实施和维护7.7 小结3数据库设计概述数据库设计概述数据库设计是指对于一个给定的应用环境,构造(设计)优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。目标:为用户和各种应用系统提供一个信息基础设施和高效率的运行环境47.1 数据库设计概述数据库设计概述7.

2、1.1 数据库设计的特点7.1.2 数据库设计方法7.1.3 数据库设计的基本步骤7.1.4 数据库设计过程中的各级模式57.1.1 数据库设计的特点数据库设计的特点三分技术,七分管理,十二分基础数据管理数据库建设项目管理企业(即应用部门)的业务管理基础数据收集、入库更新新的数据结构(数据)设计和行为(处理)设计相结合6结构和行为分离的设计结构和行为分离的设计(Page 200)数据分析概念模型设计逻辑数据库设计物理数据库设计子模式设计建立数据库数据库设计功能分析功能模型事务设计应用设计应用开发系统调试功能说明应用系统设计现实世界77.1.2 数据库设计方法数据库设计方法手工与经验相结合的方法

3、(早期)设计质量与设计人员的经验和水平有直接关系数据库运行一段时间后常常不同程度地发现各种问题,增加了维护代价规范设计法基本思想:过程迭代和逐步求精8数据库设计方法数据库设计方法新奥尔良(New Orleans)方法把数据库设计分为若干阶段和步骤,并采用辅助手段实现每一过程基于E-R模型的数据库设计方法概念设计阶段广泛采用3NF(第三范式)的设计方法用关系数据库理论为指导来设计数据库的逻辑模型,逻辑阶段可采用的有效方法ODL(Object Definition Language)方法面向对象的数据库设计方法9计算机辅助设计ORACLE Designer 2000SYBASE PowerDesi

4、gner107.1.3 数据库设计的基本步骤数据库设计的基本步骤数据库设计分为6个阶段需求分析概念结构设计逻辑结构设计物理结构设计数据库实施数据库运行和维护需求分析和概念结构设计独立于任何DBMS逻辑结构设计和物理结构设计与DBMS密切相关11数据库设计的基本步骤数据库设计的基本步骤准备工作:选定参加设计的人系统分析人员、数据库设计人员自始至终参与数据库设计数据库管理员和用户主要参加需求分析和数据库的运行维护应用开发人员(程序员和操作员)在系统实施阶段参与进来,负责编制程序和准备软硬件环境12数据库设计的过程数据库设计的过程(1/6)需求分析阶段准确了解与分析用户需求(包括数据与处理)整个设计

5、过程的基础最困难、最耗费时间的一步13概念结构设计阶段整个数据库设计的关键通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型数据库设计的过程数据库设计的过程(2/6)14逻辑结构设计阶段将概念结构转换为某个DBMS所支持的数据模型对其进行优化数据库设计的过程数据库设计的过程(3/6)15数据库物理设计阶段为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)数据库设计的过程数据库设计的过程(4/6)16数据库实施阶段运用DBMS提供的数据库语言(如SQL)及宿主语言,根据逻辑设计和物理设计的结果建立数据库编制与调试应用程序组织数据入库进行试运行数据库设计

6、的过程数据库设计的过程(5/6)17数据库运行和维护阶段数据库应用系统经过试运行后即可投入正式运行在数据库系统运行过程中必须不断地对其进行评价、调整与修改数据库设计的过程数据库设计的过程(6/6)18数据库设计的基本步骤数据库设计的基本步骤设计一个完善的数据库应用系统往往是上述六个阶段的不断反复 (Page 202,图 7.2)把数据库设计和对数据库中数据处理的设计紧密结合起来将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计197.1.4数据库设计过程中的各级模式数据库设计过程中的各级模式207.2 需求分析需求分析7.2.1 需求分析的任务7

7、.2.2 需求分析的方法7.2.3 数据字典217.2.1 需求分析的任务需求分析的任务需求分析的任务需求分析的重点需求分析的难点22需求分析的任务需求分析的任务详细调查现实世界要处理的对象(组织、部门、企业等)充分了解原系统(手工系统或计算机系统)工作概况明确用户的各种需求确定新系统的功能充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库23需求分析的重点需求分析的重点调查的重点是“数据”和“处理”,通过调查、收集与分析,获得用户对数据库的要求信息要求处理要求安全性与完整性要求24需求分析的难点需求分析的难点确定用户的最终需求用户缺少计算机知识设计人员缺少用户的专业知识解决方法

8、设计人员必须不断深入地与用户进行交流257.2.2 需求分析的方法需求分析的方法调查需求达成共识分析表达需求26调查用户需求的具体步骤调查用户需求的具体步骤调查组织机构情况调查各部门的业务活动情况在熟悉业务活动的基础上,协助用户明确对新系统的各种要求,包括信息要求,处理要求,安全性与完整性要求确定新系统的边界27常用的调查方法常用的调查方法跟班作业开调查会请专人介绍询问设计调查表请用户填写查阅记录28进一步分析和表达用户需求进一步分析和表达用户需求结构化分析方法(Structured Analysis,简称SA方法)从最上层的系统组织机构入手采用自顶向下、逐层分解的方式分析系统29进一步分析和

9、表达用户需求进一步分析和表达用户需求系统高层抽象图数据来源数据输出数据存储处理数据流数据流30分解处理功能和数据分解处理功能:将处理功能的具体内容分解为若干子功能分解数据:逐级分解所用数据,形成若干层次的数据流图表达方法处理逻辑:用判定表或判定树来描述数据:用数据字典来描述将分析结果再次提交给用户,征得用户认可31需求分析过程327.2.3 数据字典数据字典数据字典是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要结果数据字典的内容数据项数据结构数据流数据存储处理过程33数据项数据项数据项是不可再分的数据单位数据项描述 数据项名,数据项含义说明,别名,数据类型,长度,取值范

10、围,取值含义,与其他数据项的逻辑关系,数据项之间的联系34数据结构数据结构数据结构反映了数据之间的组合关系一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成数据结构描述数据结构名,含义说明,组成:数据项或数据结构35数据流数据流数据流是数据结构在系统内传输的路径数据流描述 数据流名,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量36数据存储数据存储数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一数据存储描述数据存储名,说明,编号,输入的数据流,输出的数据流,组成:数据结构,数据量,存取频度,存取方式37处理过程处

11、理过程具体处理逻辑一般用判定表或判定树来描述处理过程描述处理过程名,说明,输入:数据流,输出:数据流,处理:简要说明38数据字典举例数据字典举例例:学生学籍管理子系统的数据字典数据项:学号含义说明:唯一标识每个学生别名:学生编号类型:字符型长度:8取值范围:00000000至99999999取值含义:前两位标别该学生所在年级,后六位按顺序编号39数据结构,以“学生”为例“学生”是该系统中的一个核心数据结构数据结构:学生含义说明:是学籍管理子系统的主体数据结构,定义了一个学生的有关信息组成:学号,姓名,性别,年龄,所在系,年级40数据流,“体检结果”可如下描述数据流:体检结果说明:学生参加体格检

12、查的最终结果数据流来源:体检数据流去向:批准组成:平均流量:高峰期流量:41数据存储,“学生登记表”可如下描述数据存储:学生登记表说明:记录学生的基本情况流入数据流:流出数据流:组成:数据量:每年3000张存取方式:随机存取42处理过程“分配宿舍”可如下描述处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生,宿舍输出:宿舍安排处理:在新生报到后,为所有新生分配学生宿舍要求同一间宿舍只能安排同一性别的学生同一个学生只能安排在一个宿舍中每个学生的居住面积不小于3平方米安排新生宿舍其处理时间应不超过15分钟43数据字典数据字典数据字典是关于数据库中数据的描述,是元数据,而不是数据本身数据字典在

13、需求分析阶段建立,在数据库设计过程中不断修改、充实、完善44需求分析小结需求分析小结设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充必须强调用户的参与457.3 概念结构设计概念结构设计7.3.1 概念结构7.3.2 概念结构设计的方法与步骤7.3.3 数据抽象与局部视图设计7.3.4 视图的集成467.3.1 概念结构概念结构什么是概念结构设计将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定概念结构设计是整个数据库设计的关键47概念结构设计的特点能真实、充分地反映现实世界易

14、于理解易于更改易于向关系、网状、层次等各种数据模型转换48描述概念模型的工具E-R模型497.3.2 概念结构设计的方法与步骤概念结构设计的方法与步骤设计概念结构的四类方法自顶向下自底向上逐步扩张混合策略50自顶向下:首先定义全局概念结构的框架,然后逐步细化51自底向上:首先定义各局部应用的概念结构,然后集成得到全局概念结构52逐步扩张:首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构53混合策略将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构54概念结构设计的方法与步骤概念

15、结构设计的方法与步骤常用策略自顶向下地进行需求分析自底向上地设计概念结构55自底向上设计概念结构的步骤第1步:抽象数据并设计局部视图第2步:集成局部视图,得到全局概念结构567.3.3 数据抽象与局部视图设计数据抽象与局部视图设计数据抽象局部视图设计57数据抽象数据抽象概念结构是对现实世界的一种抽象抽象是对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。58三种常用的数据抽象三种常用的数据抽象分类(Classification)聚集(Aggregation)概括(Generalization)59分类(C

16、lassification)定义某一类概念作为现实世界中一组对象的类型抽象了对象值和型之间的“is member of”的语义三种常用的数据抽象三种常用的数据抽象6061聚集(Aggregation)定义某一类型的组成成分抽象了对象内部类型和成分之间“is part of”的语义三种常用的数据抽象三种常用的数据抽象6263复杂的聚集,某一类型的成分仍是一个聚集64概括(Generalization)定义类型之间的一种子集联系抽象了类型之间的“is subset of”的语义继承性:子类继承超类上定义的所有抽象三种常用的数据抽象三种常用的数据抽象6566局部视图设计局部视图设计设计分E-R图的步

17、骤选择局部应用逐一设计分E-R图67选择局部应用选择局部应用在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点通常以中层数据流图作为设计分E-R图的依据68选择局部应用选择局部应用69逐一设计分逐一设计分E-R图图任务将各局部应用涉及的数据分别从数据字典中抽取出来参照数据流图,标定各局部应用中的实体、实体的属性、实体的码确定实体之间的联系及其类型(1:1,1:n,m:n)70逐一设计分逐一设计分E-R图图两条准则属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成属性不能与其他实体具有联系。联系只发生在实体之间7172实例:销售管理子系统分E-

18、R图的设计销售管理子系统的主要功能处理顾客和销售员送来的订单工厂是根据订货安排生产的交出货物同时开出发票收到顾客付款后,根据发票存根和信贷情况进行应收款处理73第一层数据流图第一层数据流图(Page 216)74第二层数据流图第二层数据流图接收订单75第二层数据流图第二层数据流图处理订单76第二层数据流图第二层数据流图开发票77第二层数据流图第二层数据流图支付过账78逐一设计分逐一设计分E-R图图79参照第二层数据流图和数据字典,遵循两个准则,进行如下调整:订单与订单细节是1n 的联系原订单和产品的联系实际上是订单细节和产品的联系图7.21中“发票主清单”是一个数据存储,不必作为实体加入分E-

19、R图工厂对大宗订货给予优惠,应增加折扣规则80得到分E-R图如下图所示81对每个实体定义的属性如下:顾客:顾客号,顾客名,地址,电话,信贷状况,账目余额订单:订单号,顾客号,订货项数,订货日期,交货日期,工种号,生产地点订单细则:订单号,细则号,零件号,订货数,金额应收账款:顾客号,订单号,发票号,应收金额,支付日期,支付金额,当前余额,货款限额产品描述:产品号,产品名,单价,重量折扣规则:产品号,订货量,折扣827.3.4 视图的集成视图的集成各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图83视图集成的两种方式视图集成的两种方式多个分E-R图

20、一次集成一次集成多个分E-R图通常用于局部视图比较简单时逐步集成用累加的方式一次集成两个分E-R图84视图集成的两种方式视图集成的两种方式85视图的集成视图的集成集成局部E-R图的步骤合并修改与重构86视图的集成视图的集成87合并分合并分E-R图,生成初步图,生成初步E-R图图各分E-R图存在冲突各个分E-R图之间必定会存在许多不一致的地方合并分E-R图的主要工作与关键合理消除各分E-R图的冲突88合并分合并分E-R图,生成初步图,生成初步E-R图图冲突的种类属性冲突命名冲突结构冲突89属性冲突属性冲突属性域冲突属性值的类型取值范围取值集合不同属性取值单位冲突90命名冲突命名冲突同名异义:不同

21、意义的对象在不同的局部应用中具有相同的名字异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字91结构冲突结构冲突同一对象在不同应用中具有不同的抽象同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同实体之间的联系在不同局部视图中呈现不同的类型92消除不必要的冗余,设计基本消除不必要的冗余,设计基本E-R图图冗余消除冗余的方法93冗余冗余冗余的数据是指可由基本数据导出的数据冗余的联系是指可由其他联系导出的联系冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难消除不必要的冗余后的初步E-R图称为基本E-R图94消除冗余的方法消除冗余的方法分析方法以数据字

22、典和数据流图为依据根据数据字典中关于数据项之间的逻辑关系的说明来消除冗余95消除冗余的方法消除冗余的方法Q3=Q1 Q2Q4=Q596效率 vs.冗余信息需要根据用户的整体需求来确定若人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为完整性约束条件Q4=Q5一旦Q5修改后就应当触发完整性检查,对Q4进行修改97消除冗余的方法消除冗余的方法规范化理论函数依赖的概念提供了消除冗余联系的形式化工具98确定分E-R图实体之间的数据依赖,并用实体码之间的函数依赖表示(1)部门和职工之间一对多的联系可表示为:职工号职工号部门号部门号(2)职工和产品之间多对多的联系可表示为:(职工号,产品(职工号

23、,产品号)号)工作天数工作天数(3)函数依赖集FL99求FL的最小覆盖GL,差集为D=FL-GL逐一考察D中的函数依赖,确定是否是冗余的联系,若是,就把它去掉冗余的联系一定在D中,而D中的联系不一定是冗余的当实体之间存在多种联系时要将实体之间的联系在形式上加以区分100实例.某工厂管理信息系统的视图集成书中图1.14(c)、图7.24、图7.29分别为该厂物资、销售和劳动人事管理的分E-R图图7.30为该系统的基本E-R图(Page 223)101集成过程,解决了以下问题异名同义,项目和产品含义相同库存管理中职工与仓库的工作关系已包含在劳动人事管理的部门与职工之间的联系之中,所以可以取消职工之

24、间领导与被领导关系可由部门与职工(经理)之间的领导关系、部门与职工之间的从属关系两者导出,所以也可以取消102验证整体概念结构验证整体概念结构视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件:整体概念结构内部必须具有一致性,不存在互相矛盾的表达整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系整体概念结构能满足需求分析阶段所确定的所有要求103整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据104概念结构设计小结概念结构设

25、计小结概念结构设计的步骤抽象数据并设计局部视图集成局部视图,得到全局概念结构验证整体概念结构105概念结构设计小结概念结构设计小结数据抽象分类 聚集概括106概念结构设计小结概念结构设计小结设计局部视图选择局部应用逐一设计分E-R图标定局部应用中的实体、属性、码、实体间的联系用E-R图描述出来107集成局部视图合并分E-R图,生成初步E-R图消除属性冲突、命名冲突、结构冲突修改与重构消除不必要的冗余,设计生成基本E-R图分析方法:规范化理论1087.4 逻辑结构设计逻辑结构设计逻辑结构设计的任务把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构逻辑结

26、构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换对数据模型进行优化109逻辑结构设计的逻辑结构设计的3个步骤个步骤1107.4 逻辑结构设计逻辑结构设计7.4.1 E-R图向关系模型的转换7.4.2 数据模型的优化7.4.3 设计用户子模式1117.4.1 E-R图向关系模型的转换图向关系模型的转换转换内容转换原则112E-R图向关系模型转换要解决的问题如何将实体型和实体间的联系转换为关系模式如何确定这些关系模式的属性和码转换内容将E-R图转换为关系模型:将实体、实体的属性和实体之间的联系转换为关系模式113实体型间的联系有

27、以下不同情况一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并114一个m:n联系转换为一个关系模式例如:“选修”联系是一个m:n联系,可以将它转换为如下关系模式,其中学号与课程号为关系的组合码:选修(学号,课程号,成绩)115三个或三个以上实体间的一个多元联系转换为一个关系模式例如:“讲授”联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、职工号和书号为关系的组合码:讲授(课程号,职工号,书号)116具有相同码的关系模式可合并目的:减少系统中的关系个数合并方法:将其中一个关系模式的

28、全部属性加入到另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适当调整属性的次序117从理论上讲,1:1联系可以与任意一端对应的关系模式合并 但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标1187.4.2 数据模型的优化数据模型的优化得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化关系数据模型的优化通常以规范化理论为指导119优化数据模型的方法优化数据模型的方法确定数据依赖每个关系模式内部

29、各属性之间的数据依赖以及不同关系模式属性之间数据依赖消除冗余的联系对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系确定所属范式分析这些模式对于应用环境是否合适,确定是否要对它们进行合并或分解对关系模式进行必要的合并或分解120例如:在关系模式学生成绩单(学号,英语,数学,语文,平均成绩)中存在下列函数依赖:l学号英语l学号数学l学号语文l学号平均成绩l(英语,数学,语文)平均成绩虽然平均成绩可以由其他属性推算出来,但如果需要经常查询学生的平均成绩,为提高效率,仍然可保留该冗余数据,对关系模式不再做进一步分解121数据模型的优化数据模型的优化按照需求分析阶段得到的各种应用对数据处理的

30、要求,对关系模式进行必要的分解,以提高数据操作的效率和存储空间利用率常用分解方法水平分解垂直分解122水平分解什么是水平分解?把(基本)关系的元组分为若干子集合,定义每个子集合为一个子关系,以提高系统的效率水平分解的适用范围满足“80/20原则”的应用并发事务经常存取不相交的数据123垂直分解什么是垂直分解?把关系模式R的属性分解为若干子集合,形成若干子关系模式垂直分解的适用范围取决于分解后R上的所有事务的总效率是否得到了提高1247.4.3 设计用户子模式设计用户子模式定义用户外模式时应该注重的问题使用更符合用户习惯的别名针对不同级别的用户定义不同的视图,以满足系统对安全性的要求简化用户对系

31、统的使用125例如:关系模式产品(产品号,产品名,规格,单价,生产车间,生产负责人,产品成本,产品合格率,质量等级),可以在产品关系上建立两个视图为一般顾客建立视图:产品1(产品号,产品名,规格,单价)为产品销售部门建立视图:产品2(产品号,产品名,规格,单价,车间,生产负责人)可以防止用户非法访问不允许他们查询的数据,保证系统的安全性126逻辑结构设计小结逻辑结构设计小结任务:将概念结构转化为具体的数据模型逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换对数据模型进行优化设计用户子模式127逻辑结构设计小结逻辑结构设

32、计小结E-R图向关系模型的转换内容E-R图向关系模型的转换原则128逻辑结构设计小结逻辑结构设计小结优化数据模型的方法确定数据依赖对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系确定各关系模式分别属于第几范式分析这些模式对于应用环境是否合适,确定是否要对它们进行合并或分解对关系模式进行必要的合并或分解129逻辑结构设计小结逻辑结构设计小结设计用户子模式使用更符合用户习惯的别名针对不同级别的用户定义不同的外模式,以满足系统对安全性的要求简化用户对系统的使用1307.5 数据库的物理设计数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理

33、系统为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计131数据库物理设计的步骤数据库物理设计的步骤确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构对物理结构进行评价,评价的重点是时间和空间效率如果评价结果满足原设计要求,则可进入到物理实施阶段否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型1321337.5 数据库的物理设计数据库的物理设计7.5.1 数据库物理设计的内容和方法7.5.2 关系模式存取方法选择7.5.3 确定数据库的存储结构7.5.4 评价物理结构1347.5.1 数据库物理设计的内容和方法数据库物理设计

34、的内容和方法设计物理数据库结构的准备工作对要运行的事务进行详细分析,获得选择物理数据库设计所需要的参数充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构135选择物理数据库设计所需参数选择物理数据库设计所需参数数据库查询事务查询的关系查询条件所涉及的属性连接条件所涉及的属性查询的投影属性136选择物理数据库设计所需参数选择物理数据库设计所需参数数据更新事务被更新的关系每个关系上的更新操作条件所涉及的属性修改操作要改变的属性值每个事务在各关系上运行的频率和性能要求137关系数据库物理设计的内容关系数据库物理设计的内容为关系模式选择存取方法(建立存取路径)设计关系、索引等数据库文

35、件的物理存储结构1387.5.2 关系模式存取方法选择关系模式存取方法选择数据库系统是多用户共享的系统,对同一个关系要建立多条存取路径才能满足多用户的多种应用要求物理设计的任务之一就是要确定选择哪些存取方法,即建立哪些存取路径139DBMS常用存取方法索引方法主要是B+树索引方法经典存取方法,使用最普遍聚簇(Cluster)方法HASH方法140一、索引存取方法的选择一、索引存取方法的选择根据应用要求确定对哪些属性列建立索引对哪些属性列建立组合索引对哪些索引要设计为唯一索引141选择索引存取方法的一般规则如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索

36、引)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引关系上定义的索引数过多会带来较多额外开销维护索引的开销,查找索引的开销142二、聚簇存取方法的选择二、聚簇存取方法的选择为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇。143聚簇的用途聚簇的用途大大提高按聚簇码进行查询的效率节省存储空间聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了144例如:假设学

37、生关系按所在系建索引,现在要查询信息系的所有学生名单信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数145聚簇的局限性聚簇的局限性聚簇只能提高某些特定应用的性能建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动146聚簇的适用范围聚簇的适用范围既适用于单个关系独立聚簇,也适用于多个关系组合聚簇当通过聚簇码进行访问或连接是该关系的主要应

38、用,与聚簇码无关的其他访问很少或者是次要的,可以使用聚簇尤其当SQL语句中包含有与聚簇码有关的ORDER BY,GROUP BY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作147设计候选聚簇设计候选聚簇对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。否则,聚簇效果不明显148优化聚簇设计优化聚簇设计从聚簇中删除经常进行全表扫描的关系从聚簇中删除更新操作远多于连接操作的关系不同

39、的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇从多个聚簇方案(包括不建立聚簇)中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小149HASH存取方法的选择存取方法的选择选择HASH存取方法的规则当一个关系满足下列两个条件时,可以选择HASH存取方法该关系的属性主要出现在等值连接条件中或主要出现在相等比较选择条件中该关系的大小可预知,而且不变 or 该关系的大小动态改变,但所选用的DBMS提供了动态HASH存取方法1507.5.3 确定数据库的存储结构确定数据库的存储结构确定数据的存放位置和存储结构关系索引聚簇日志备份确定系统配置151确定数据存放位置和存

40、储结构的因素确定数据存放位置和存储结构的因素存取时间存储空间利用率维护代价这三个方面常常是相互矛盾的例如:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加。必须进行权衡,选择一个折中方案152确定数据的存放位置的基本原则确定数据的存放位置的基本原则根据应用情况将易变部分与稳定部分分开存放。存取频率较高部分与存取频率较低部分,分开存放。153确定数据的存放位置确定数据的存放位置数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上如果计算机有多个磁盘或磁盘阵列,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工

41、作,可以提高物理I/O读写的效率可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能154确定系统配置确定系统配置DBMS产品一般都提供了一些存储分配参数同时使用数据库的用户数同时打开的数据库对象数内存分配参数使用的缓冲区长度、个数存储分配参数.1557.5.4 评价物理结构评价物理结构评价内容对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构156物理结构评价方法物理结构评价方法(完全依赖于所选用的DBMS)定量估算各种方案存储空间存取时间维护代价对估算结

42、果进行权衡、比较,选择出一个较优的合理的物理结构如果该结构不符合用户需求,则需要修改设计1577.6 数据库实施和维护数据库实施和维护7.6.1 数据的载入和应用程序的调试7.6.2 数据库的试运行7.6.3 数据库的运行和维护1587.6.1 数据的载入和应用程序的调试数据的载入和应用程序的调试数据的载入应用程序的编码和调试159数据的载入数据的载入数据库结构建立好后,就可以向数据库中装载数据了。组织数据入库是数据库实施阶段最主要的工作数据装载方法人工方法计算机辅助数据入库160应用程序的编码和调试应用程序的编码和调试数据库应用程序的设计应该与数据设计并行进行在组织数据入库的同时还要调试应用

43、程序1617.6.2 数据库的试运行数据库的试运行在原有系统的数据有一小部分已输入数据库后,就可以开始对数据库系统进行联合调试,称为数据库的试运行162数据库试运行的主要工作数据库试运行的主要工作功能测试实际运行数据库应用程序,执行对数据库的各种操作,测试应用程序的功能是否满足设计要求如果不满足,对应用程序部分则要修改、调整,直到达到设计要求163性能测试测量系统的性能指标,分析是否达到设计目标如果测试的结果与设计目标不符,则要返回物理设计阶段,重新调整物理结构,修改系统参数,某些情况下甚至要返回逻辑设计阶段,修改逻辑结构164数据库的试运行数据库的试运行强调两点:(1)分期分批组织数据入库重

44、新设计物理结构甚至逻辑结构,会导致数据重新入库由于数据入库工作量实在太大,费时、费力,所以应分期分批地组织数据入库先输入小批量数据供调试用,待试运行基本合格后再大批量输入数据。逐步增加数据量,逐步完成运行评价165数据库的试运行数据库的试运行(2)数据库的转储和恢复在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生系统的操作人员对新系统还不熟悉,误操作也不可避免因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏1667.6.3 数据库的运行与维护数据库的运行与维护数据库试运行合格后,数据库即可投入正式运行数据库投入运行标志着开发任务的基本完成和维护工作的开始对数据库设计进行评

45、价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高应用环境在不断变化数据库运行过程中物理存储会不断变化167数据库的运行与维护数据库的运行与维护在数据库运行阶段,对数据库经常性的维护工作主要是由DBA完成的,包括:数据库的转储和恢复数据库的安全性、完整性控制数据库性能的监督、分析和改进数据库的重组织和重构造168数据库的重组织和重构造重组织的形式全部重组织部分重组织:只对频繁增、删的表进行重组织重组织的目标提高系统性能169重组织的工作:按原设计要求重新安排存储位置回收垃圾减少指针链数据库的重组织不会改变原设计的数据逻辑结构和物理结构170数据库重构造根据新环境调整数据库的模式

46、和内模式增加新的数据项改变数据项的类型改变数据库的容量增加或删除索引修改完整性约束条件1717.7 小结小结数据库的设计过程需求分析概念结构设计逻辑结构设计物理设计实施和维护172数据库各级模式的形成数据库的各级模式是在设计过程中逐步形成的需求分析阶段综合各个用户的应用需求(现实世界的需求)概念设计阶段形成独立于机器特点、独立于各个DBMS产品的概念模式(信息世界模型),用E-R图来描述173在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型如关系模型,形成数据库逻辑模式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图,形成数据的外模式在物理设计阶段根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁