第2讲 分布式数据库设计PPT讲稿.ppt

上传人:石*** 文档编号:49894203 上传时间:2022-10-12 格式:PPT 页数:85 大小:4.38MB
返回 下载 相关 举报
第2讲 分布式数据库设计PPT讲稿.ppt_第1页
第1页 / 共85页
第2讲 分布式数据库设计PPT讲稿.ppt_第2页
第2页 / 共85页
点击查看更多>>
资源描述

《第2讲 分布式数据库设计PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第2讲 分布式数据库设计PPT讲稿.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第2讲 分布式数据库设计第1页,共85页,编辑于2022年,星期一内容概要内容概要pp分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容pp分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标pp分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法pp自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库pp实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统pp自底向上设计分布式数据库自底向上设计分布式数据库自底向

2、上设计分布式数据库自底向上设计分布式数据库2022/10/112第2页,共85页,编辑于2022年,星期一1 1 分布式数据库设计内容分布式数据库设计内容pp集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:数据库设计数据库设计数据库设计数据库设计和围绕数据和围绕数据和围绕数据和围绕数据库而展开的库而展开的库而展开的库而展开的应用设计应用设计应用设计应用设计两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容也可分为:分布式数

3、据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的应用设计两个部分。应用设计两个部分。应用设计两个部分。应用设计两个部分。pp分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优

4、化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。2022/10/113第3页,共85页,编辑于2022年,星期一pp数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的主要问题是主要问题是主要问题是主要问题是模式模式模式模式和和和和内模式问题内模式问题内模式问题内模式问题。

5、这两个问题在分布式数据库中。这两个问题在分布式数据库中。这两个问题在分布式数据库中。这两个问题在分布式数据库中变为变为变为变为全局模式设计全局模式设计全局模式设计全局模式设计和每个站点的和每个站点的和每个站点的和每个站点的局部数据库设计局部数据库设计局部数据库设计局部数据库设计的问题,其的问题,其的问题,其的问题,其中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适的站点上。这就产生了分布式数据库设计所特有的两个问题:的站点上。这

6、就产生了分布式数据库设计所特有的两个问题:的站点上。这就产生了分布式数据库设计所特有的两个问题:的站点上。这就产生了分布式数据库设计所特有的两个问题:数据的数据的数据的数据的分片设计分片设计分片设计分片设计和和和和片段的位置分配设计片段的位置分配设计片段的位置分配设计片段的位置分配设计。2022/10/114第4页,共85页,编辑于2022年,星期一分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的“逻辑准则逻辑准则逻辑准则逻辑准则”。片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上

7、的片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上的“物理布物理布物理布物理布局局局局”。这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定最优的分片和分配。最优的分片和分配。最优的分片和分配。最优的分片和分配。2022/10/115第5页,共85页,编辑于2022年,星期一pp在分布式数据库系统设计中,为使分片设计和片段的位置在分布式数据库系统设计中,为使分片设计和片段的位置在分布式数据

8、库系统设计中,为使分片设计和片段的位置在分布式数据库系统设计中,为使分片设计和片段的位置分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:的确切要求,包括:的确切要求,包括:的确切要求,包括:各个应用的各个应用的各个应用的各个应用的“原发站点原发站点原发站点原发站点”,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。各个应用在每个站点被激活的频率(单位时间内被激活的次各个应用在每个站点被激活

9、的频率(单位时间内被激活的次各个应用在每个站点被激活的频率(单位时间内被激活的次各个应用在每个站点被激活的频率(单位时间内被激活的次数)数)数)数)各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统计分布。计分布。计分布。计分布。很容易获知很容易获知不太容易获知不太容易获知很难获知很难获知2022/10/116第6页,共85页,编辑于2022年,星期一pp数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性

10、能。数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性能。访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区别。因为如果分布在多个站点上,就要进行站点与站点别。因为如果分布在多个站点上,就要进行站点与站点别。因为如果分布在多个站点上,就要进

11、行站点与站点别。因为如果分布在多个站点上,就要进行站点与站点之间的通信。之间的通信。之间的通信。之间的通信。2 2 分布式数据库设计目标分布式数据库设计目标影响分布式数据库性能的因素内容影响分布式数据库性能的因素内容2022/10/117第7页,共85页,编辑于2022年,星期一pp数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据的多副本不但可以提高系统的可用性和可靠性,而且还可以数据的多副本不但可以提高系统的可用性和可靠性,而且还可以数据

12、的多副本不但可以提高系统的可用性和可靠性,而且还可以数据的多副本不但可以提高系统的可用性和可靠性,而且还可以提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。pp分布式数据库设计者必须仔细考虑数据是否分片,片段如何分布式数据库

13、设计者必须仔细考虑数据是否分片,片段如何分布式数据库设计者必须仔细考虑数据是否分片,片段如何分布式数据库设计者必须仔细考虑数据是否分片,片段如何复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。2022/10/118第8页,共85页,编辑于2022年,星期一pp尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和通信量,也就是使数据和应用实现最大程度的本地

14、性。通信量,也就是使数据和应用实现最大程度的本地性。通信量,也就是使数据和应用实现最大程度的本地性。通信量,也就是使数据和应用实现最大程度的本地性。解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,“90%90%90%90%的数据的数据的数据的数据应当在本地站点找到,而只有应当在本地站点找到,而只有应当在

15、本地站点找到,而只有应当在本地站点找到,而只有10%10%10%10%的数据需要在远程站点上的数据需要在远程站点上的数据需要在远程站点上的数据需要在远程站点上进行访问进行访问进行访问进行访问”。设计目标设计目标2022/10/119第9页,共85页,编辑于2022年,星期一pp控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。冗

16、余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致

17、性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制数据副本的增加。数据副本的增加。数据副本的增加。数据副本的增加。2022/10/1110第10页,共85页,编辑于2022年,星期一pp进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资源,以提高应用执行的平行程度,从而提高系统的性能。源,以提高应用执行的平行程度,从而提高系统的性能。源,以提高应用执行的平行程度,从而提高系统的性能。源,

18、以提高应用执行的平行程度,从而提高系统的性能。工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。pp考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力

19、的影响。数据库的分布会受到各站点的存储能力的影响。2022/10/1111第11页,共85页,编辑于2022年,星期一pp分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方法。法。法。法。pp自顶向下方法的设计特点:自顶向下方法的设计特点:自顶向下方

20、法的设计特点:自顶向下方法的设计特点:一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。3 3 分布式数据库设计方法分布式数据库设计方法2022/10/1112第12页,共85页

21、,编辑于2022年,星期一pp自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局概念模式。概念模式。概念模式。概念模式。pp在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际

22、情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分又使用自底向上方法。2022/10/1113第13页,共85页,编辑于2022年,星期一pp需求分析需求分析需求分析需求分析收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的定义和在设计数据库中要

23、考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在设计数据字典中。设计数据字典中。设计数据字典中。设计数据字典中。pp概念设计概念设计概念设计概念设计有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数据库模式的一种概念规格说明和在此模式上执行应用的概据库模式的一种概念规格说明和在此模式上执行应用的概据库模

24、式的一种概念规格说明和在此模式上执行应用的概据库模式的一种概念规格说明和在此模式上执行应用的概念规格说明。念规格说明。念规格说明。念规格说明。4 4 自顶向下设计分布式数据库自顶向下设计分布式数据库集中式数据库自顶向下设计过程集中式数据库自顶向下设计过程2022/10/1114第14页,共85页,编辑于2022年,星期一pp逻辑设计逻辑设计逻辑设计逻辑设计将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的DBMSDBMSDBMSDBMS类型的数据库模式。选择类型的数据库模式。选择类型的数据库模式。选择类型的数据库模式。选择DBMSD

25、BMSDBMSDBMS类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。pp物理设计物理设计物理设计物理设计要遵照所选择的特定要遵照所选择的特定要遵照所选择的特定要遵照所选择的特定DBMSDBMSDBMSDBMS的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据库的物理访问结构的定义。库的物理访问结构的定义。库的物理访问结构的定义。库的物理访问结构的定义。2022/10/1115第15页,共85页,编

26、辑于2022年,星期一pp在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。以一个全局的、与站点无关的模式作为输入,以产生分布以一个全局的、与站点无关的模式作为输入,以产生分布以一个全局的、与站点无关的模式作为输入,以产生分布以一个全局的、与站点无关的模式作为输入,以产生分布式数据库个站点的子模式(局部概念模式)作为输出。式数据库个站点的子模式(局部概念模式)作为输出。式数据库个站点的子模式(局部概念模式)作为输出。式数据库个站点的子模式(局部概念模式)作为输出。分布设计包括数据的分片设计和片

27、段的位置分配设计。分布设计包括数据的分片设计和片段的位置分配设计。分布设计包括数据的分片设计和片段的位置分配设计。分布设计包括数据的分片设计和片段的位置分配设计。分片是指把一全局对象细分成若干逻辑片段的过程;分片是指把一全局对象细分成若干逻辑片段的过程;分片是指把一全局对象细分成若干逻辑片段的过程;分片是指把一全局对象细分成若干逻辑片段的过程;分配是指把各片段映射到一个或多个站点的过程,片分配是指把各片段映射到一个或多个站点的过程,片分配是指把各片段映射到一个或多个站点的过程,片分配是指把各片段映射到一个或多个站点的过程,片段是最合适的数据分配单位。段是最合适的数据分配单位。段是最合适的数据分

28、配单位。段是最合适的数据分配单位。分布式数据库自顶向下设计过程分布式数据库自顶向下设计过程2022/10/1116第16页,共85页,编辑于2022年,星期一需求分析概念设计视图设计分布设计物理设计观察与监视系统需求全局概念模式访问模式外部模式定义局部概念模式物理模式用户输入视图集成用户输入反馈反馈自顶向下设计过程2022/10/1117第17页,共85页,编辑于2022年,星期一pp在自顶向下的数据分布设计中,必须要解决的第一个问题是数据在自顶向下的数据分布设计中,必须要解决的第一个问题是数据在自顶向下的数据分布设计中,必须要解决的第一个问题是数据在自顶向下的数据分布设计中,必须要解决的第一

29、个问题是数据的分片设计。的分片设计。的分片设计。的分片设计。pp数据分片将数据库整体逻辑结构分解为合适的逻辑单位数据分片将数据库整体逻辑结构分解为合适的逻辑单位数据分片将数据库整体逻辑结构分解为合适的逻辑单位数据分片将数据库整体逻辑结构分解为合适的逻辑单位片段,然后由分配模式来定义片段及其副本在各场地的物理片段,然后由分配模式来定义片段及其副本在各场地的物理片段,然后由分配模式来定义片段及其副本在各场地的物理片段,然后由分配模式来定义片段及其副本在各场地的物理分布,其主要目的是提高访问的局部性,有利于按照用户的分布,其主要目的是提高访问的局部性,有利于按照用户的分布,其主要目的是提高访问的局部

30、性,有利于按照用户的分布,其主要目的是提高访问的局部性,有利于按照用户的需求组织数据的分布和控制数据的冗余度需求组织数据的分布和控制数据的冗余度需求组织数据的分布和控制数据的冗余度需求组织数据的分布和控制数据的冗余度。分片设计分片设计 2022/10/1118第18页,共85页,编辑于2022年,星期一pp分片设计的基本目的是产生一个对全局数据合适的划分方分片设计的基本目的是产生一个对全局数据合适的划分方分片设计的基本目的是产生一个对全局数据合适的划分方分片设计的基本目的是产生一个对全局数据合适的划分方案。使用这种方案得到的片段作为分布式数据库中数据的案。使用这种方案得到的片段作为分布式数据库

31、中数据的案。使用这种方案得到的片段作为分布式数据库中数据的案。使用这种方案得到的片段作为分布式数据库中数据的分配和存储单位时,不但能够减少应用中的操作量,而且分配和存储单位时,不但能够减少应用中的操作量,而且分配和存储单位时,不但能够减少应用中的操作量,而且分配和存储单位时,不但能够减少应用中的操作量,而且能够对于应用具有最大可能的本地性。能够对于应用具有最大可能的本地性。能够对于应用具有最大可能的本地性。能够对于应用具有最大可能的本地性。pp不是所有的全局数据都必须进行分片。不是所有的全局数据都必须进行分片。不是所有的全局数据都必须进行分片。不是所有的全局数据都必须进行分片。2022/10/

32、1119第19页,共85页,编辑于2022年,星期一pp在数据分片设计时,根据具有在数据分片设计时,根据具有在数据分片设计时,根据具有在数据分片设计时,根据具有“相同性质相同性质相同性质相同性质”的元组或属性划分的元组或属性划分的元组或属性划分的元组或属性划分在一个组中,每组就构成一个片段。在一个组中,每组就构成一个片段。在一个组中,每组就构成一个片段。在一个组中,每组就构成一个片段。pp如果同一个片段的任两个元素具有如果同一个片段的任两个元素具有如果同一个片段的任两个元素具有如果同一个片段的任两个元素具有“相同性质相同性质相同性质相同性质”的话,那么的话,那么的话,那么的话,那么数据分配时所

33、使用的任意一种方法都将把这两个元素放在一起,数据分配时所使用的任意一种方法都将把这两个元素放在一起,数据分配时所使用的任意一种方法都将把这两个元素放在一起,数据分配时所使用的任意一种方法都将把这两个元素放在一起,以这种方式得到的片段将是分布式数据库中数据最合适的分配以这种方式得到的片段将是分布式数据库中数据最合适的分配以这种方式得到的片段将是分布式数据库中数据最合适的分配以这种方式得到的片段将是分布式数据库中数据最合适的分配和存储单位。和存储单位。和存储单位。和存储单位。2022/10/1120第20页,共85页,编辑于2022年,星期一pp水平分片:通过对一全局对象的实例(或元组)进行选择得

34、水平分片:通过对一全局对象的实例(或元组)进行选择得水平分片:通过对一全局对象的实例(或元组)进行选择得水平分片:通过对一全局对象的实例(或元组)进行选择得到的子集构成。一般来说,水平分段是不相交的。到的子集构成。一般来说,水平分段是不相交的。到的子集构成。一般来说,水平分段是不相交的。到的子集构成。一般来说,水平分段是不相交的。pp垂直分片:通过将全局对象在其属性子集上进行投影得到的。垂直分片:通过将全局对象在其属性子集上进行投影得到的。垂直分片:通过将全局对象在其属性子集上进行投影得到的。垂直分片:通过将全局对象在其属性子集上进行投影得到的。pp混合分片:通过交替水平分片与垂直分片,可以产

35、生混合分片。混合分片:通过交替水平分片与垂直分片,可以产生混合分片。混合分片:通过交替水平分片与垂直分片,可以产生混合分片。混合分片:通过交替水平分片与垂直分片,可以产生混合分片。建立混合分片最简单的方法包括:把水平分片应用到垂直分片建立混合分片最简单的方法包括:把水平分片应用到垂直分片建立混合分片最简单的方法包括:把水平分片应用到垂直分片建立混合分片最简单的方法包括:把水平分片应用到垂直分片中或把垂直分片应用到水平分片中。中或把垂直分片应用到水平分片中。中或把垂直分片应用到水平分片中。中或把垂直分片应用到水平分片中。数据分片的基本类型和方法数据分片的基本类型和方法 2022/10/1121第

36、21页,共85页,编辑于2022年,星期一ppR=RR=RR=RR=R1 1 1 1,R,R,R,R2 2 2 2,R,R,R,Rn n n n,则则则则 R R R R满足满足满足满足完备性原则:要把所有的数据映射到各个片断中完备性原则:要把所有的数据映射到各个片断中完备性原则:要把所有的数据映射到各个片断中完备性原则:要把所有的数据映射到各个片断中?x?x?x?x R,R,R,R,R R R Ri i i i R R R R 必有必有必有必有 x x x x R R R Ri i i i ,i=1,2,i=1,2,i=1,2,i=1,2,n,n,n,n可重构原则:关系分片后的各个片断可重构

37、整个关系可重构原则:关系分片后的各个片断可重构整个关系可重构原则:关系分片后的各个片断可重构整个关系可重构原则:关系分片后的各个片断可重构整个关系?存在函数存在函数存在函数存在函数 g g g g 使得使得使得使得R=g(RR=g(RR=g(RR=g(R1 1 1 1,R,R,R,R2 2 2 2,R,R,R,Rn n n n)即,即,即,即,R=R=R=R=R R R Ri i i i(水平分片)水平分片)水平分片)水平分片),R=R=R=R=R R R Ri i i i(垂直分片)(垂直分片)(垂直分片)(垂直分片)不相交原则:关系分片后的各个片断不能重叠不相交原则:关系分片后的各个片断不

38、能重叠不相交原则:关系分片后的各个片断不能重叠不相交原则:关系分片后的各个片断不能重叠R R R Ri i i iR R R Rj j j j=空集空集空集空集,i,i,i,ijjjj,i,j=1,2,i,j=1,2,i,j=1,2,i,j=1,2,n(,n(,n(,n(水平分片水平分片水平分片水平分片)R R R Ri i i iR R R Rj j j j=主键属性主键属性主键属性主键属性,i,j=1,2,i,j=1,2,i,j=1,2,i,j=1,2,n(,n(,n(,n(垂直分片垂直分片垂直分片垂直分片)数据分片规则数据分片规则2022/10/1122第22页,共85页,编辑于2022

39、年,星期一pp水平分片的方法可分为初级分片和导出分片两类。水平分片的方法可分为初级分片和导出分片两类。水平分片的方法可分为初级分片和导出分片两类。水平分片的方法可分为初级分片和导出分片两类。初级水平分片以关系自身的属性性质为基础,执行初级水平分片以关系自身的属性性质为基础,执行初级水平分片以关系自身的属性性质为基础,执行初级水平分片以关系自身的属性性质为基础,执行“选择选择选择选择”操作,将该关系分片成若干个不相交的片段。操作,将该关系分片成若干个不相交的片段。操作,将该关系分片成若干个不相交的片段。操作,将该关系分片成若干个不相交的片段。导出式水平分片是从另一个关系的属性性质或水平片导出式水

40、平分片是从另一个关系的属性性质或水平片导出式水平分片是从另一个关系的属性性质或水平片导出式水平分片是从另一个关系的属性性质或水平片段推导出来的。采用导出分片可使片段与片段之间的段推导出来的。采用导出分片可使片段与片段之间的段推导出来的。采用导出分片可使片段与片段之间的段推导出来的。采用导出分片可使片段与片段之间的“连接连接连接连接”变得更容易。变得更容易。变得更容易。变得更容易。水平分片实施方法水平分片实施方法2022/10/1123第23页,共85页,编辑于2022年,星期一pp例例例例 S S S S(S#S#S#S#,SNAMESNAMESNAMESNAME,AGEAGEAGEAGE,S

41、EXSEXSEXSEX)ppDefine fragement S1 as select*from s where sex=Define fragement S1 as select*from s where sex=Define fragement S1 as select*from s where sex=Define fragement S1 as select*from s where sex=M M M M ppDefine fragement S1 as select*from s where sex=Define fragement S1 as select*from s wher

42、e sex=Define fragement S1 as select*from s where sex=Define fragement S1 as select*from s where sex=F F F F 初级水平分片初级水平分片2022/10/1124第24页,共85页,编辑于2022年,星期一p初级分片中执行选择操作的条件(或称谓词)叫做限定语。初级分片中执行选择操作的条件(或称谓词)叫做限定语。如如Sex=Sex=F F和和SEX=SEX=M M是限定语。是限定语。p水平分片正确性原则的三个条件可以这样来实现:水平分片正确性原则的三个条件可以这样来实现:完整性条件。各片段定义中

43、的限定语集合必须是完整的,即完整性条件。各片段定义中的限定语集合必须是完整的,即完整性条件。各片段定义中的限定语集合必须是完整的,即完整性条件。各片段定义中的限定语集合必须是完整的,即至少是它们允许值的集合。如至少是它们允许值的集合。如至少是它们允许值的集合。如至少是它们允许值的集合。如SEX=SEX=SEX=SEX=M M M M,F F F F ,季节,季节,季节,季节=春,夏,秋,冬春,夏,秋,冬春,夏,秋,冬春,夏,秋,冬 2022/10/1125第25页,共85页,编辑于2022年,星期一可重构条件。如果限定语集合是完整的,则通过并操作总可重构条件。如果限定语集合是完整的,则通过并操

44、作总可重构条件。如果限定语集合是完整的,则通过并操作总可重构条件。如果限定语集合是完整的,则通过并操作总能重构全局关系。能重构全局关系。能重构全局关系。能重构全局关系。不相交条件。如果限定语之间是互斥的,它们的片段必不不相交条件。如果限定语之间是互斥的,它们的片段必不不相交条件。如果限定语之间是互斥的,它们的片段必不不相交条件。如果限定语之间是互斥的,它们的片段必不相交。相交。相交。相交。令令令令P=P1P=P1P=P1P=P1,P2P2P2P2,P3P3P3P3,。,。,。,。,PnPnPnPn是一简单谓词的集合,为了正是一简单谓词的集合,为了正是一简单谓词的集合,为了正是一简单谓词的集合,

45、为了正确而有效地进行分片,则确而有效地进行分片,则确而有效地进行分片,则确而有效地进行分片,则P P P P必须是必须是必须是必须是“完整的完整的完整的完整的”和和和和“最小的最小的最小的最小的”。满足:满足:满足:满足:2022/10/1126第26页,共85页,编辑于2022年,星期一只有当属于同一分片中的任意两个元组被任一应只有当属于同一分片中的任意两个元组被任一应只有当属于同一分片中的任意两个元组被任一应只有当属于同一分片中的任意两个元组被任一应用以同等概率进行访问时,称谓语集合用以同等概率进行访问时,称谓语集合用以同等概率进行访问时,称谓语集合用以同等概率进行访问时,称谓语集合P P

46、 P P是完整的。是完整的。是完整的。是完整的。如果谓词如果谓词如果谓词如果谓词P P P P的全部谓词与应用密切相关,称的全部谓词与应用密切相关,称的全部谓词与应用密切相关,称的全部谓词与应用密切相关,称P P P P是最是最是最是最小的。小的。小的。小的。2022/10/1127第27页,共85页,编辑于2022年,星期一 例:例:例:例:EMP(E#,NAME,DEPT,JOB,SAL,TEL,EMP(E#,NAME,DEPT,JOB,SAL,TEL,EMP(E#,NAME,DEPT,JOB,SAL,TEL,EMP(E#,NAME,DEPT,JOB,SAL,TEL,)DEPT=1,2 J

47、OB=DEPT=1,2 JOB=DEPT=1,2 JOB=DEPT=1,2 JOB=P P P P,-P-P-P-P 假定,应用经常查询的内容是属于部门假定,应用经常查询的内容是属于部门假定,应用经常查询的内容是属于部门假定,应用经常查询的内容是属于部门1 1 1 1且是程序员的职员。且是程序员的职员。且是程序员的职员。且是程序员的职员。则可能有的水平分段限定则可能有的水平分段限定则可能有的水平分段限定则可能有的水平分段限定 P=DEPT=1 P=DEPT=1 P=DEPT=1 P=DEPT=1 (不是完整的)(不是完整的)(不是完整的)(不是完整的)P=DEPT=1,JOB=P=DEPT=1

48、,JOB=P=DEPT=1,JOB=P=DEPT=1,JOB=P P P P (是完整的、最小的)(是完整的、最小的)(是完整的、最小的)(是完整的、最小的)P=DEPT=1,JOB=P=DEPT=1,JOB=P=DEPT=1,JOB=P=DEPT=1,JOB=P P P P,SAL500,SAL500,SAL500,SAL500(完整的,不是最小的)(完整的,不是最小的)(完整的,不是最小的)(完整的,不是最小的)2022/10/1128第28页,共85页,编辑于2022年,星期一pp例例例例2 2 2 2 设全局关系设全局关系设全局关系设全局关系SCSCSCSC(s#s#s#s#,C#C#

49、C#C#,GRADEGRADEGRADEGRADE)S S S S(s#s#s#s#,SNAMESNAMESNAMESNAME,AGEAGEAGEAGE,SEXSEXSEXSEX)若要将若要将若要将若要将SCSCSCSC划分为男生的各门课成绩和女生的各门课成绩。划分为男生的各门课成绩和女生的各门课成绩。划分为男生的各门课成绩和女生的各门课成绩。划分为男生的各门课成绩和女生的各门课成绩。这就不能从这就不能从这就不能从这就不能从SCSCSCSC本身的属性性质来执行选择,必须从关系本身的属性性质来执行选择,必须从关系本身的属性性质来执行选择,必须从关系本身的属性性质来执行选择,必须从关系S S S

50、S的的的的属性性质或水平片段来导出。属性性质或水平片段来导出。属性性质或水平片段来导出。属性性质或水平片段来导出。ppDefine fragment SC1 asDefine fragment SC1 asDefine fragment SC1 asDefine fragment SC1 as Select SC.S#,C#,GRADE from SC,S Select SC.S#,C#,GRADE from SC,S Select SC.S#,C#,GRADE from SC,S Select SC.S#,C#,GRADE from SC,S where SC.S#=S.S#and SEX=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁