《第五章5-5物理结构设计.ppt》由会员分享,可在线阅读,更多相关《第五章5-5物理结构设计.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章第七章第七章 数据库设计数据库设计数据库设计数据库设计5.1 5.1 数据库设计概述数据库设计概述5.2 5.2 需求分析需求分析5.3 5.3 概念结构设计概念结构设计5.4 5.4 逻辑结构设计逻辑结构设计5.5 5.5 数据库的物理设计数据库的物理设计5.6 5.6 数据库的实施和维护数据库的实施和维护5.5 5.5 小结小结5.5 5.5 5.5 5.5 数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计v数据库的物理设计数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据
2、库管理系统库的物理结构,它依赖于选定的数据库管理系统为一个给定的逻辑数据模型选取一个最适合应用环境为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计的物理结构的过程,就是数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计(续续续续)v数据库物理设计的步骤数据库物理设计的步骤确定数据库的物理结构,在关系数据库中主要指存取方法和确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构存储结构 对物理结构进行评价,评价的重点是时间和空间效率对物理结构进行评价,评价的重点是时间和空间效率 如果评价结果满足原设计要求,则可进入到物理实施
3、阶段,如果评价结果满足原设计要求,则可进入到物理实施阶段,否则,就需要重新设计或修改物理结构,有时甚至要返回逻否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型辑设计阶段修改数据模型数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计(续续续续)数据库物理设计数据库物理设计确定数确定数据库的据库的物理结物理结构构评价数据评价数据库的物理库的物理结构结构逻辑结逻辑结构设计构设计数据库数据库实施实施物理物理模型模型逻辑逻辑模型模型5.5 5.5 5.5 5.5 数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计5.5.1 5.5.1 数据库物理设计
4、的内容和方法数据库物理设计的内容和方法5.5.2 5.5.2 关系模式存取方法选择关系模式存取方法选择5.5.3 5.5.3 确定数据库的存储结构确定数据库的存储结构5.5.4 5.5.4 评价物理结构评价物理结构5.5.1 5.5.1 5.5.1 5.5.1 5.5.1 5.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法数据库物理设计的内容和方法数据库物理设计的内容和方法数据库物理设计的内容和方法数据库物理设计的内容和方法v设计物理数据库结构的准备工作设计物理数据库结构的准备工作对要运行的事务进行详细分析,获得选择物理数据库对要运行的事务进行详细分析,获得选择物理数据库设计所需
5、参数设计所需参数充分了解所用充分了解所用RDBMSRDBMS的内部特征,特别是系统提供的存的内部特征,特别是系统提供的存取方法和存储结构取方法和存储结构数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)v选择物理数据库设计所需参数选择物理数据库设计所需参数 数据库查询事务数据库查询事务查询的关系查询的关系 查询条件所涉及的属性查询条件所涉及的属性 连接条件所涉及的属性连接条件所涉及的属性 查询的投影属性查询的投影属性 数据库的物理设计的内容和方法(续数
6、据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)v选择物理数据库设计所需参数选择物理数据库设计所需参数(续续)数据更新事务数据更新事务被更新的关系被更新的关系每个关系上的更新操作条件所涉及的属性每个关系上的更新操作条件所涉及的属性 修改操作要改变的属性值修改操作要改变的属性值 每个事务在各关系上运行的频率和性能要求每个事务在各关系上运行的频率和性能要求数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续数据库
7、的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)v关系数据库物理设计的内容关系数据库物理设计的内容为关系模式选择为关系模式选择存取方法存取方法(建立存取路径建立存取路径)设计关系、索引等数据库文件的设计关系、索引等数据库文件的物理存储结构物理存储结构5.5 5.5 5.5 5.5 数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计5.5.1 5.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法5.5.2 5.5.2 关系模式存取方法选择关系模式存取方法选择5.5.3 5.5.3 确定数据库的存储结构确定数据库的存储结构5.5.4 5.5.4 评价物理结构评
8、价物理结构5.5.2 5.5.2 5.5.2 5.5.2 关系模式存取方法选择关系模式存取方法选择关系模式存取方法选择关系模式存取方法选择v数据库系统是多用户共享的系统,对同一个关系要建立数据库系统是多用户共享的系统,对同一个关系要建立多多条存取路径条存取路径才能满足多用户的多种应用要求才能满足多用户的多种应用要求v物理设计的任务之一就是要确定选择哪些存取方法,即物理设计的任务之一就是要确定选择哪些存取方法,即建建立哪些存取路径立哪些存取路径关系模式存取方法选择(续)关系模式存取方法选择(续)关系模式存取方法选择(续)关系模式存取方法选择(续)vDBMSDBMS常用存取方法常用存取方法索引方法
9、索引方法目前主要是目前主要是B+B+树索引方法树索引方法经典存取方法,使用最普遍经典存取方法,使用最普遍 聚簇(聚簇(ClusterCluster)方法方法HASHHASH方法方法一、索引存取方法的选择一、索引存取方法的选择一、索引存取方法的选择一、索引存取方法的选择v根据应用要求确定根据应用要求确定 对哪些属性列建立索引对哪些属性列建立索引 对哪些属性列建立组合索引对哪些属性列建立组合索引 对哪些索引要设计为唯一索引对哪些索引要设计为唯一索引索引存取方法的选择(续)索引存取方法的选择(续)索引存取方法的选择(续)索引存取方法的选择(续)v选择索引存取方法的一般规则选择索引存取方法的一般规则如
10、果一个如果一个(或一组或一组)属性经常在查询条件中出现,则考虑在这属性经常在查询条件中出现,则考虑在这个个(或这组或这组)属性上建立索引属性上建立索引(或组合索引或组合索引)如果一个属性经常作为最大值和最小值等聚集函数的参数,如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引则考虑在这个属性上建立索引如果一个如果一个(或一组或一组)属性经常在连接操作的连接条件中出现,属性经常在连接操作的连接条件中出现,则考虑在这个则考虑在这个(或这组或这组)属性上建立索引属性上建立索引v关系上定义的索引数过多会带来较多的额外开销关系上定义的索引数过多会带来较多的额外开销 维护索引的
11、开销维护索引的开销 查找索引的开销查找索引的开销二、聚簇存取方法的选择二、聚簇存取方法的选择二、聚簇存取方法的选择二、聚簇存取方法的选择v聚簇聚簇为了提高某个属性(或属性组)的查询速度,把这个或这些为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇物理块称为聚簇聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的用途聚簇的用途1.1.大大提高按聚簇码进行查询的效率大大提高按聚簇码进行查询的效率 例:假设学生关系按所在系建有索
12、引,现在要查询信息系例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。的所有学生名单。信息系的信息系的500500名学生分布在名学生分布在500500个不同的物理块上时,个不同的物理块上时,至少要执行至少要执行500500次次I/OI/O操作操作如果将同一系的学生元组集中存放,则每读一个物如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数减少了访问磁盘的次数聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)2.2.节省存储空间节省存
13、储空间聚簇以后,聚簇码相同的元组集中在一起了,因聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了一组中存一次就行了聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的局限性聚簇的局限性1.1.聚簇只能提高某些特定应用的性能聚簇只能提高某些特定应用的性能2.2.建立与维护聚簇的开销相当大建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,
14、必须重建并使此关系上原有的索引无效,必须重建当一个元组的聚簇码改变时,该元组的存储位置也要做相应移当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动动聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的适用范围聚簇的适用范围1.1.既适用于单个关系独立聚簇,也适用于多个关系组既适用于单个关系独立聚簇,也适用于多个关系组合聚簇合聚簇例:假设用户经常要按系别查询学生成绩单,这一查询涉例:假设用户经常要按系别查询学生成绩单,这一查询涉及学生关系和选修关系的连接操作,即需要按学号连接这及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,
15、为提高连接操作的效率,可以把具有相同学号两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按于把多个关系按“预连接预连接”的形式存放,从而大大提高连的形式存放,从而大大提高连接操作的效率。接操作的效率。聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)2.2.当通过聚簇码进行访问或连接是该关系的主要应用,当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要的时,可以与聚簇码无关的其他访问很少或者是次要的时,可
16、以使用聚簇。使用聚簇。尤其当尤其当SQLSQL语句中包含有与聚簇码有关的语句中包含有与聚簇码有关的ORDER BYORDER BY,GROUP BYGROUP BY,UNIONUNION,DISTINCTDISTINCT等子句或短语时,使用等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作聚簇特别有利,可以省去对结果集的排序操作聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)v设计候选聚簇设计候选聚簇对经常在一起进行连接操作的关系可以建立聚簇对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条如果一个关系
17、的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇件中,则该单个关系可建立聚簇如果一个关系的一个如果一个关系的一个(或一组或一组)属性上的值重复率属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效簇码值的平均元组数不太少。太少了,聚簇的效果不明显果不明显聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)聚簇存取方法的选择(续)v优化聚簇设计优化聚簇设计从聚簇中删除经常进行全表扫描的关系;从聚簇中删除经常进行全表扫描的关系;从聚簇中删除更新操作远多于连接操作的关系;从聚簇中删
18、除更新操作远多于连接操作的关系;不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇但不能同时加入多个聚簇 从这多个聚簇方案从这多个聚簇方案(包括不建立聚簇包括不建立聚簇)中选择一个较优的,即中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小在这个聚簇上运行各种事务的总代价最小三、三、三、三、HASHHASHHASHHASH存取方法的选择存取方法的选择存取方法的选择存取方法的选择v选择选择HASHHASH存取方法的规则存取方法的规则当一个关系满足下列两个条件时,可以选择当一个关系满足下列两个条件时,
19、可以选择HASHHASH存取方法存取方法该关系的属性主要出现在该关系的属性主要出现在等值连接等值连接条件中或主要出现在条件中或主要出现在相相等比较等比较选择条件中选择条件中该关系的大小可预知,而且不变;该关系的大小可预知,而且不变;或或 该关系的大小动态改变,但所选用的该关系的大小动态改变,但所选用的DBMSDBMS提供了动态提供了动态HASHHASH存取方法存取方法5.5 5.5 5.5 5.5 数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计5.5.1 5.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法5.5.2 5.5.2 关系模式存取方法选择关系模式存取方
20、法选择5.5.3 5.5.3 确定数据库的存储结构确定数据库的存储结构5.5.4 5.5.4 评价物理结构评价物理结构5.5.3 5.5.3 5.5.3 5.5.3 确定数据库的存储结构确定数据库的存储结构确定数据库的存储结构确定数据库的存储结构v确定数据库物理结构的内容确定数据库物理结构的内容1.1.确定数据的存放位置和存储结构确定数据的存放位置和存储结构 关系关系 索引索引 聚簇聚簇 日志日志 备份备份2.2.确定系统配置确定系统配置1.1.1.1.确定数据的存放位置确定数据的存放位置确定数据的存放位置确定数据的存放位置v确定数据存放位置和存储结构的因素确定数据存放位置和存储结构的因素存取
21、时间存取时间存储空间利用率存储空间利用率维护代价维护代价 这三个方面常常是相互矛盾的这三个方面常常是相互矛盾的 例:消除一切冗余数据虽能够节约存储空间和减少例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加维护代价,但往往会导致检索代价的增加 必须进行权衡,选择一个折中方案必须进行权衡,选择一个折中方案确定数据的存放位置(续)确定数据的存放位置(续)确定数据的存放位置(续)确定数据的存放位置(续)v基本原则基本原则根据应用情况将根据应用情况将易变易变部分与部分与稳定稳定部分分开存放部分分开存放存取频率较高存取频率较高部分与部分与存取频率较低存取频率较低部分,分开存
22、放部分,分开存放确定数据的存放位置(续)确定数据的存放位置(续)确定数据的存放位置(续)确定数据的存放位置(续)例:例:数据库数据备份、日志文件备份等由于只在故障恢复时才数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上使用,而且数据量很大,可以考虑存放在磁带上如果计算机有多个磁盘或磁盘阵列如果计算机有多个磁盘或磁盘阵列 ,可以考虑将表和索,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工作,可以提高物理行工作,可以提高物理I/OI/O读写的效率读写的效率 确定数据的存放位置(续)
23、确定数据的存放位置(续)确定数据的存放位置(续)确定数据的存放位置(续)例(续):例(续):可以将比较大的表分别放在两个磁盘上,以加快可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效存取速度,这在多用户环境下特别有效可以将日志文件与数据库对象(表、索引等)放可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能在不同的磁盘以改进系统的性能2.2.2.2.确定系统配置确定系统配置确定系统配置确定系统配置vDBMSDBMS产品一般都提供了一些存储分配参数产品一般都提供了一些存储分配参数 同时使用数据库的用户数同时使用数据库的用户数 同时打开的数据库对象数
24、同时打开的数据库对象数 内存分配参数内存分配参数 使用的缓冲区长度、个数使用的缓冲区长度、个数 存储分配参数存储分配参数 .5.5 5.5 5.5 5.5 数据库的物理设计数据库的物理设计数据库的物理设计数据库的物理设计5.5.1 5.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法5.5.2 5.5.2 关系模式存取方法选择关系模式存取方法选择5.5.3 5.5.3 确定数据库的存储结构确定数据库的存储结构5.5.4 5.5.4 评价物理结构评价物理结构5.5.4 5.5.4 5.5.4 5.5.4 评价物理结构评价物理结构评价物理结构评价物理结构v评价内容评价内容对数据库物理设
25、计过程中产生的多种方案进行细致的对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结评价,从中选择一个较优的方案作为数据库的物理结构构评价物理结构评价物理结构评价物理结构评价物理结构(续续续续)v评价方法(完全依赖于所选用的评价方法(完全依赖于所选用的DBMS DBMS)定量估算各种方案定量估算各种方案 存储空间存储空间 存取时间存取时间 维护代价维护代价对估算结果进行权衡、比较,选择出一个较优的合理的对估算结果进行权衡、比较,选择出一个较优的合理的物理结构物理结构如果该结构不符合用户需求,则需要修改设计如果该结构不符合用户需求,则需要修改设计数据库物理设计小结:数据库物理设计小结:数据库物理设计小结:数据库物理设计小结:v1 1、确定数据库的物理结构确定数据库的物理结构1)确定数据的存储结构确定数据的存储结构(1)适当冗余适当冗余(2)增加聚簇功能增加聚簇功能2)设计数据的存取路径设计数据的存取路径(1)建立索引建立索引3)确定数据的存放位置确定数据的存放位置(1)分盘存放分盘存放4)确定系统配置确定系统配置(1)参数优化参数优化v2 2、评价数据库的物理结构评价数据库的物理结构1)存储空间存储空间2)存取时间存取时间3)维护代价维护代价