分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt

上传人:春哥&#****71; 文档编号:4268953 上传时间:2021-07-16 格式:PPT 页数:678 大小:6.86MB
返回 下载 相关 举报
分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt_第1页
第1页 / 共678页
分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt_第2页
第2页 / 共678页
点击查看更多>>
资源描述

《分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt》由会员分享,可在线阅读,更多相关《分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt(678页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、分布式数据库系统及其应用,分布式数据库系统的起源和发展 分布式数据库系统的定义和分类 分布式数据库系统的体系结构 分布式数据库系统与客户机/服务器模式 分布式数据库管理系统 其他非集中式数据库系统 分布式数据库目录系统的主要内容和逻辑结构 分布式数据库系统的主要技术 分布式数据库系统的主要应用 分布式数据库系统的优点和存在的技术问题,分布式数据库系统概述,第1章,计算机平台环境的改变 卫星通信 蜂窝通信 局域网 广域网 Intranet Internet 信息系统应用需求 地域上分散、管理集中的企业越来越多 既要求实现本地数据管理,就要求存取异地的数据 既要有各部门的局部控制和分散管理;又要有

2、整个组织的全局控制和高层次的协同管理,分布式数据库发展阶段 20世纪70年代末期产生 20世纪80年代成长阶段 20世纪90年代商品化应用阶段 21世纪大规模应用阶段 分布式数据库系统的12条规则 本地自治性 不依赖于中心节点 可连续操作性 位置独立性 数据分片独立性 数据复制独立性,分布式查询处理 分布式事务处理 硬件独立性 操作系统独立性 网络独立性 数据库管理系统独立性,分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。分布式数据库系统可以看成是计算机

3、网络和数据库系统的有机结合。 分布式数据库系统的特点 物理分布性:数据不是存放在一个站点上 逻辑整体性:是与分散式数据库系统的区别 站点自治性:是与多处理机系统的区别 数据分布透明性 集中与自治相结合 存在适当的数据冗余度 事务管理的分布性,分布式数据库系统示意图,按局部DBMS的数据模型分类 同构型DDBS 同构同质型 同构异质型 异构型DDBS 按DDBS的全局控制类型分类 全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点 全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。 全局控制可变型DDBS:也称主从型DDBS。分成两组站点,一组包含全局控制机制

4、和全局控制词典,另外一组不包含。,分布式数据库系统的体系结构,基于客户机服务器模式的系统可以看作是真正意义上的分布式系统的一某些站点是客户机站点,而另一些站点是服务器站点; 所有的数据都驻留在服务器站点; 所有的应用都在客户机站点运行; 应用请求是通过客户机请求和服务器响应的协作方式来完成的; 一般不提供完全的位置透明性,即“存在接缝”。,分布式数据库系统是在集中式数据库系统基础上发展起来的,但不是简单地把集中式数据库系统分散地实现, 负责负责实现分布式数据库的建立、查询、更新、复制和维护等功能,同时还包括提供分布透明性,查询优化、协调全局事务的执行,协调各局部DBMS共同完成全局应用,保证数

5、据库的全局一致性,执行并发控制,实现更新同步和全局恢复等功能。它 除此之外,还具有自己的性质和特征。 数据跟踪 分布式查询处理 分布式事务管理 复制数据的管理 安全性 分布式目录管理,P2P模型是一种新型的体系结构模型,面向大范围的多数据资源节点的松散耦合。 每个对等计算机地位相同,可直接互连实现各种资源的共享,不需要依赖集中式服务器支持。 典型的P2P系统主要有以下三种结构:纯粹分布式P2P系统结构、集中目录P2P系统结构以及混合式P2P系统结构 P2P系统的主要特点有: 每个节点均可贡献数据,系统资源具有丰富性、多样性; 可直接访问数据源中的数据资源,即时得到最新鲜的数据,不同于集中的数据

6、资源库,如数据仓库等; 采用自组织原则,具有健壮性; 每个节点可随时加入和退出,系统具有分散性、可扩展性; 通常以Web上的资源为节点,系统部署简单,不需要复杂的框架部署实现。,(a)纯粹分布式P2P系统结构 (b)集中目录分布式P2P系统结构 (c)混合式分布式P2P系统结构,(a),(b),(c),多数据库系统(Multi-Database Systems,MDBS)是多个已存在的、自治的、异构的数据库系统的联合。 参与构成多数据库系统的数据库系统称为局部或成员数据库系统(Local Database System,LDBS)。多 数据库系统是在己经存在的数据库系统之上为用户提供一个统一的

7、存取数据的环境。,分布式数据库的目录系统(Catalog System)是存放与分布式数据库系统有关的对象和各种控制信息的场所。 主要功能包括:,全局模式描述 分片模式描述 分布模式描述 局部名映射 存取方法描述 数据库的统计信息,一致性错误 状态信息 数据表述 数据命令 系统描述,分布式数据库目录系统可与分布式数据库系统协同工作,将用户对数据的高级查询转化为相应存储对象的低级操作,而且满足数据独立性要求。 验证用户对数据的访问权限,保证合法用户能正确而有效地访问数据库中的数据。主要功能包括: 设计应用 翻译应用 优化处理 运行监督 系统维护,分布式数据库目录系统的组织方式通常有以下三种: 独

8、立式 利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。 分离式 利用DBMS建立和维护目录信息,但它的用户界面与功能均独立于DBMS。 嵌入式 DBMS与目录系统一体化,即目录系统作为DBMS的子集而存在,在分布式数据库系统中通常采用这种方法。,分布式数据库目录系统的组织方式通常有以下三种: 独立式 利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。 分离式 利用DBMS建立和维护目录信息,但它的用户界面与功能均独立于DBMS。 嵌入式 DBMS与目录系统一体化

9、,即目录系统作为DBMS的子集而存在,在分布式数据库系统中通常采用这种方法。,分布式数据库目录由目录系统进行管理。 目录系统在网络操作系统和分布式数据库管理系统的支持下实现对数据目录进行自动管理,并保持其在动态变化过程中数据目录的一致性和有效性。 目录系统有以下功能模块组成: 目录定义:描述目录信息的逻辑结构和模式表示。 目录装入:负责目录信息的装入与存储。 目录查询:负责解释用户对目录信息的查询请求,处理各种查询要求。 目录更新:用于更新目录信息。 目录维护:用于在不破坏目录模式定义的前提下,对目录信息进行分类、归并、重构与链接。 报告生成:将目录信息以文本格式输出。,集中式目录:全局系统目

10、录采用集中式存放方式 全复制式目录:在每个站点上都存放一个完整的全局目录,但目录的更新必须传播到每一个站点。 局部式目录:每个站点只为存放在本站点的数据保留一份目录(局部目录),系统的整体目录是所有这些不相交的局部目录的集合。 混合式目录 :混合式目录是上述三种方式的混合使用,是折中的目录分布方案,包括: 集中式目录与局部式目录相混合。 全复制式目录与局部式目录相混合。,分布式数据库设计方法主要有两种: 自顶向下方法 自底向上方法 前者从头开始设计分布式数据库,而后者则通过集成现有数据库来设计分布式数据库。,分布式环境下影响查询效率的因素有很多 除了集中式查询下的CPU和I/O代价外,数据在网

11、络站点之间的传输、数据的冗余和分布都会对查询的效率产生很大的影响。 分布式查询优化的准则是使通信费用最低和响应时间最短,即以最小的总代价、在最短的响应时间内获得需要的数据。最基本的查询优化方法是基于关系代数等价变换的查询优化方法。 此外,考虑局部代价和传输代价的不同情况,还有多种查询优化方法: 基于半连接算法的查询优化处理方法 基于直接连接算法的查询优化处理方法 分布式INGRES算法 R*算法和SDD-1算法等,分布式DBMS系统中的分布式事务管理程序必须即保证本地事务的ACID特性又保证分布式事务的ACID特性 事务管理程序的本地事务管理程序负责保证本地事务的ACID特性,而分布式事务的A

12、CID特性则由两阶段提交协议来保证。 当发生故障时,要使得分布式数据库恢复到一个正确的、一致的状态。恢复的基本原理是数据冗余,即利用冗余存储在别处的信息和数据,部分或全部重建数据库。,分布式数据库中的并发控制是以集中式数据库中的并发控制技术为基础的,主要解决多个分布式事务对数据并发执行的正确性。 分布式数据库系统并发控制的主要内容包括: 分布式数据库系统并发控制的封锁技术 分布式数据库系统中的死锁处理 分布式数据库系统并发控制的时标技术 分布式数据库系统并发控制的多版本技术 分布式数据库系统并发控制的乐观方法等,分布式数据库的可靠性是指分布式数据库在一个给定的时间间隔内不产生任何失败的概率。

13、它强调分布式数据库的正确性,要求分布式数据库在符合某种要求情况下正确地运行。一 个可靠性高的系统要求故障少、容易修复或者修复得快。 分布式数据库失败的主要原因有错误的设计、不稳定或临界的组件、不稳定的外部环境和操作者的过失等。 分布式数据库的可靠性协议可以保证在分布式数据库上执行的分布式事务的原子性和持久性。,分布式数据库面临的安全问题主要有: 单站点故障、 网络故障、 各类管理制度的不完善、 人为攻击(黑客攻击)、 内部人员泄露密码数据、 程序内嵌的不安全因素等引起的安全问题等。 分布式数据库的安全性的的内容主要包括:保证数据库安全的措施主要有建立安全数据模型、设定有效的访问控制机制、建立多

14、级安全数据库、数据加密等。,移动分布式数据库系统 连锁超市分布式数据库系统 火车订票分布式数据库系统 GSP药品管理分布式数据库系统 银行管理分布式数据库系统,良好的可靠性和可用性 提高系统效率,降低通信费用 较大的灵活性和可伸缩性 经济性和保护投资 适应组织的分布式管理和控制 数据分布具有透明性和站点具有较好的自治性,最重要的问题是通信网络速度问题 如何控制数据的分片、分布与冗余度 如何实现异构数据库的互联 如何优化分布式数据库的查询处理 如何更好地实现分布式数据库的更新处理 如何实现分布式数据库的并发控制机制 如何实现分布式数据库的恢复控制机制 如何实现目录管理,总 结结,分布式数据库系统

15、概论 分布式数据库系统的定义与分类 分布式数据库系统的体系结构 分布式数据库系统与客户机/服务器模式 分布式数据库管理系统 其他非集中数据库系统 分布式数据库目录系统的主要内容和逻辑结构 分布式数据库系统的主要技术 分布式数据库系统的主要应用 分布式数据库系统的优点和存在的技术问题,分布式数据库系统及其应用,数据库技术回顾 计算机网络技术回顾,基础知识回顾,第2章,数据库系统知识回顾,数据库 (DB:DataBase),长期储存在计算机内的有组织的、可共享的相关数据的集合。,数据库技术,数据库系统软硬件层次关系,1,1 数据库系统知识回顾,数据库系统的模式结构,视图抽象外模式 概念抽象概念模式

16、 物理抽象内模式,概念模式,内模式,现实世界,视图抽象,概念抽象,物理抽象,外模式,视图2,视图1,视图3,数据库系统知识回顾,关系数据模型(Data Model),1,1.3, 数据结构 数据操作 完整性约束,用于描述系统的静态特性;是所研究的对象类型(Object type) 的集合,包括:数据的类型、内容和性质的对象(事物);数据之间 联系的对象(联系)。,数据模型的三要素,1. 数据结构:,是一组完整性规则(条件)的集合。给出数据及其联系所具有 的制约、依赖和存储规则,用于限定数据库的状态和状态变化,保 证数据库中的数据的正确、有效、完全和相容。,3. 完整性约束(Integrity

17、Constraint):,用于描述系统的动态特性,是对数据库中的各种对象的实例(值) 允许执行的操作的集合。主要有查询和更新(插入、删除、修改)两 类操作。,2. 数据操作(Data Manipulation) :,1. 数据库系统知识回顾,实体联系模型,一对一的联系,记为 11 一对多的联系,记为 1n 多对多的联系,记为 mn,实体联系类型,实体内部联系 实体之间的联系 同一实体型的实体之间的联系 不同实体型的实体之间的联系,1. 数据库系统知识回顾,SQL语言,SQL是结构化查询语言(Structured Query Language)的英文缩写,它起源于IBM公司San Jose研究中

18、心为其关系数据库管理系统System R开发的一种查询语言SQUARE语言。 SQL语言之所以成为国际标准,被广大用户接收和使用,是因为它是一个综合的、功能强大的、简单易学的语言。它主要有以下几个特点: 综合统一 高度非过程化 面向集合的操作方式 灵活的使用方式 语言简洁,易学易用,功能强大,1. 数据库系统知识回顾,SQL语言基本组成,数据定义语言,1. 数据库系统知识回顾,SQL语言基本组成,数据定义语言(续),1. 数据库系统知识回顾,SQL语言基本组成,2. 数据操作语言,1. 数据库系统知识回顾,SQL语言基本组成,2. 数据操作语言(续),1. 数据库系统知识回顾,SQL语言基本组

19、成,3. 数据控制语言,1. 数据库系统知识回顾,关系代数与关系数据库的查询优化,关系代数语言是非过程化的语言,即:存取数据不必给出路径,存取多个记录不必借助于循环或递归来实现。 关系代数操作符主要有传统的集合操作符、专门的关系操作符、比较操作符和逻辑操作符四大类,如下图所示,传统的集合操作符:, 专门的关系操作符:, , 比较操作符:, 逻辑操作符:,,传统的集合运算,1.6.2 关系代数,并运算 差运算 交运算 广义笛卡尔积,RS,R-S,R x S,数据库系统知识回顾,1,选择运算是从关系中选取使公式为真的元组。这是从行的角度进行的运算。,在关系R中选择满足给定条件的元组,记做: F (

20、R) = r | r R F(r)=真 F是一个公式,表示形式为由逻辑运算符(,)连接各算术表达式组成。 算术表达式的基本形式为:XY. =, , ,=, . X,Y是属性名或常量或简单函数。,例1 求计算机科学系CS的学生, SD=CS (S), SD=CS (S),选择运算,投影运算,这是从列的角度进行的运算。,例2 SN,SD (S) 即求得学生关系S在学生姓名和所在系这两个属性上的投影结果。,SN,SD (S),关系R上的投影是从R中选择若干属性组A组成新的关系。记做: A (R) = rA | r R 投影之后不仅取消了某些列,还可能取消某些元组。,SA (S),连接运算是从两个关系

21、的笛卡尔积中选取属性间满足一定条件的元组。 记做: R S. 其中,F是条件表达式,它涉及到对两个关系中的属性的比较。 如果F仅仅是一个相等条件,即等值连接。,连接运算, F,例3 设关系R、S如下图:,1,数据库系统知识回顾,6.3 关系数据库的查询优化,1.,1,数据库系统知识回顾,7 关系数据库的设计理论,1.,关系数据库设计理论主要包括数据依赖、模式分解和规范化理论三个方面。 三者之间的关系是:以数据依赖为核心,指导/评价模式设计,包括消除更新、删除和插入异常,并根据实际需求的需要,保持合理的冗余。 数据依赖:对属性之间值的相关性约束 函数依赖 多值依赖 连接依赖 模式分解:模式分解的

22、样式是多种多样的,但是要遵循等价原则 等价性的含义有三种不同的定义 分解具有无损连接性 分解要保持函数依赖 分解既要保持函数依赖,又要具有无损连接性,1,数据库系统知识回顾,7 关系数据库的设计理论,1.,规范化(Normalization)过程是指通过对关系模式进行一系列的检验,以“验证”一个关系模式是否满足某些特定的范式(Normalization Form,NF)。 这个过程按照各范式的相应标准对每个关系模式进行评估,并根据需要分解原有的关系模式。 规范化过程被认为是基于分析的关系设计。,规范化过程,数据库系统知识回顾,数据库建设是硬件、软件和干件(技术与管理的界面称为干件)的结合。“三

23、分技术,七分管理,十二分基础数据”是数据库建设的基本规律 结构(数据)设计应该和行为(处理)设计密切结合,也就是说,整个设计过程中要把数据库结构设计和对数据的处理设计(应用系统功能设计)密切结合起来。,1,1.8 数据库设计,数据库系统知识回顾,1,1.8.1 数据库设计方法,数据库系统知识回顾,1,1.8.2 数据库设计步骤,数据库系统知识回顾,1,1.8.3 数据库建模工具,数据库系统知识回顾,1,1.9.1 数据库管理系统,DBMS的基本功能,数据库系统知识回顾,1,1.9.2 数据库管理系统,DBMS的数据库访问过程,数据库系统知识回顾,1,1.9.2 数据库管理系统,DBMS产品的发

24、展过程,数据库系统知识回顾,1,1.9.2 数据库管理系统,典型的数据库管理系统,数据库系统知识回顾,1,1.10 数据库的安全性及其实现方法,数据库的安全性是指数据库具有防范不合法的访问所造成对数据库数据的泄露、更改或破坏的能力,并能对数据库变化作跟踪记录,以防止否认对数据库的安全责任。 数据库安全性包括: 1)物理安全性,包括自然灾害、偷盗、物理环境破坏等。 2)逻辑安全性,这里主要指政府规定的政策法规、管理制度等。 3)技术安全性,这里主要指在计算机系统中采用一定安全性的网络硬件、通信设备、DBMS和操作系统来实现对计算机系统及其存储数据的安全保护,数据库系统知识回顾,1,1.10.1

25、数据库安全的评估标准,数据库系统知识回顾,1,1.10.2 数据库安全的特点,1)身份认证:系统提供一定的方式让用户表示自己的名字或身份,主要使用用户名或口令的方式,这种方式简单易行,但容易被人窃取。 2)基于角色的管理:对不同用户设定不同的身份,不同身份的用户在使用数据库时会根据身份的不同而有不同的使用权限。 3)自主存取控制方法:同一用户对不同的数据对象有不同的存取权限,不同的用户对同一对象也有不同的权限。另外,用户还可将其拥有的存取权限转授给其他用户。通常使用GRANT/REVOKE语句来建立数据库用户对数据库对象的访问权限。 4)审计:启用一个专用的审计日志可以将用户对数据库的所有操作

26、记录在上面,DBA可以利用审计日志中的追踪信息找出非法存取数据的人,另外,C2以上安全级别的DBMS必须具有审计功能。 5)使用视图、存储过程和触发器等数据库对象。,数据库系统知识回顾,1,1.10.3 数据库完整性,数据库的完整性是指数据的正确性和相容性 实体完整性 参照完整性 用户定义的完整性 数据库完整性实现方法 声明完整性 创建其他数据库对象,如UNIQUE INDEX、DEFAULT、RULE和TRIGGER等 创建表与其他数据库对象的联系。,数据库系统知识回顾,1,1.10.4 数据库一致性,数据库一致性是指数据库中的任何数据在同一时刻,不同用户对同一数据的读出值是相同的。保证数据

27、库一致性是指当事务完成时,必须使所有数据都具有一致性状态。 数据库完整性实现方法: DBMS在实现数据库一致性时通常采用一致性访问控制机制(事务管理)以及语义约束(完整性)来联合保证。 事务管理主要包括两方面的内容: 事务控制:对数据库操作/恢复的工作以原子单位执行。 并发控制:使有冲突的操作能正确执行,如加锁技术。,数据库系统知识回顾,1,1.10.5 数据库可恢复性,数据库可恢复性是指当数据库遇到任何一种故障时,具有恢复数据库完整性和一致性的能力。 实现方法: 使用数据库的备份和恢复 使用事务日志 使用磁盘镜像,计算机网络:定义为相互联接、彼此独立的计算机系统的集合。相互联接指两台或多台计

28、算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。,计算机网络的组成:通信子网和资源子网,计算机网络的功能: 1数据通信 (1)传输文件 (2)使用电子邮件(E-mail) 2资源共享 (1)共享硬件资源 (2)共享软件资源 (3)共享数据资源。 3提高计算机系统的可靠性和可用性 4易于进行分布处理,一、按地理范围分类 1.局域网(Local Area Network) 特点 :(1) 采用的传输介质类型相对较少。 (2) 数据传输速率快。 (3) 传输延迟小,且误码率较低。 (

29、4) 组网比较灵活、方便、成本较低。 2.城域网(Metropolitan Area Network 一般不超过几十公里) 特点:(1) 采用的传输介质相对要复杂。 (2) 数据传输速率次于局域网。 (3) 数据传输距离相对局域网要长,信号容易受到干扰。 (4) 组网比较复杂,成本较高。 3. 广域网(Wide Area Network,最常见的就是Internet) 特点:(1) 传输介质复杂 (2) 数据传输速率较低 (3) 采用的技术比较复杂 (4) 是一个公共的网络,即不属于一个机构或国家。,二. 按通信介质分 1.有线网络:网络中的通信介质全部为有线介质的网络,常见的介质有同轴电缆、

30、双绞线、光缆、电话线等。其特点是: 技术成熟; 产品较多; 实施方便; 成本较低; 受气候环境的影响较小。 2.无线网络:采用无线电波、卫星、微波、红外线、激光等无线形式来传输数据的网络,即网络中的节点之间没有线缆的连接。 优点: (1)高移动性; (2)保密性强; (3)抗干扰性好; (4)架设与维护容易; (5)支持移动计算机,缺点: (1)技术发展较慢; (2)费用较高; (3)易受环境因素的影响; (4)安装实施要求的技术高。,三. 其他分类方法 1.按使用网络的对象来分 (1) 公用网络, 是为全社会所有的人提供服务的网络。 (2) 专用网络, 只为拥有者提供服务,一般不向本系统以外

31、的人提供服务。 2.按网络的连接方式来分 (1) 全连通型网络 全连通型网络是指所有节点之间的相互通信均可通过相邻的节点实现,可靠性最好。 (2) 交换型网络 交换型网络两个端节点之间可以通过中间节点(即转接节点)实现连 接。 (3)广播型网络。 3.按照通信子网的交换方式 按照通信子网的交换方式不同,网络可分为公用电路交换网、报文交换网、分组交换网、ATM交换网等。,1.星型结构 星型拓扑结构即任何两节点之间的通信都要通过中心节点进行转发,中心节点通常是集线器。 特点: (1)结构简单、便于集中控制和管理 (2)网络易于扩展 (3)故障检测和隔离方便 (4)延迟时间小 (5)传输误码率低 中

32、心节点负担重 网络脆弱,2. 总线型结构 总线型网络是将若干个节点平等地连接到一条高速公用总线上的网络。 特点: (1) 结构简单灵活,便于扩充。 (2) 可靠性高 (3) 网络节点响应速度快 (4) 易于布线,成本较低。 (5) 实时性差 物理安全性差 故障诊断困难,3 环型结构 环型结构的网络指网络中的每个节点均与下一个节点连接,最后一个节点 与第一个节点连接,构成一个闭合的环路 特点: (1) 网络结构简单 (2) 路径选择的控制得到简化 (3) 扩充不方便 (4) 环上节点过多时,传输效率严重下降。 (5) 当环中某一节点出现故障时整个网络将瘫痪,查找故障点不易。,4. 树型结构 树形

33、结构是由星型结构演变而来的。其实质是星型结构的层次堆叠 特点: (1) 扩展方便。 (2) 故障隔离容易。 (3) 高层节点性能要求高。,5. 网状结构 网状结构是由星型、总线型、环型演变而来的,是前三种基本拓扑混合应用的结果。,协议是用来描述进程之间信息交换数据时的规则术语 网络协议至少包括三个要素 语法:用来规定信息格式,包括数据及控制信息的格式、编码及信号电平等。 语义:用来说明通信双方应该怎么做,需要发出何种控制信息,以及完成的动作与做出的响应。 同步:规定通信事件发生的顺序并详细说明。,OSI网络模型,应用层:应用层是体系结构中的最高层 表示层:应用程序和网络之间的翻译官 会话层:负

34、责在网络中的两节点之间建立、维持和终止通信。 运输层:运输层的任务就是负责向两个主机进程之间的通信提供服务。 网络层:网络层负责为分组交换网上的不同主机提供通信服务。 数据链路层:在两个相邻节点传送数据时,数据链路层将网络层传递下来的IP数据报组装成帧(Frame),在两个相邻节点的链路上“透明”地传送帧中的数据。 物理层:在物理层上所传送数据的单位是比特(Bit)。,Internet是由那些使用公共语言相互通信的计算机连接而成的全球网络,中文正式译名为因特网。Internet起源于美国,现已发展成为世界上最大的国际性计算机网络。 Internet的起源和发展 第一个阶段是从单个网络ARPAN

35、et向互联网发展的过程。 第二阶段是建成了三级结构的Internet。 第三阶段是逐渐形成了多层次ISP结构的Internet,1. TCP/IP协议:TCP/IP(Transmission Control Protocol/Internet Protocol)协议是Internet使用的事实标准协议,2. IP地址和域名系统 TCP/IP协议规定了Internet上的每一台计算机主机都必须有唯一的“地址”,以保证Internet上所有的计算机和网络能够互相传送信息而不被混淆。 TCP/IP规定,IP地址一般用32位的二进制表示 为便于使用和管理,Internet建立了域名管理系统(Domai

36、n Name System,DNS),即用一组英文字符串来替代难以记忆的数字,称为域名(Domain Name),3. 基于Internet的主要应用 新闻门户 电子商务 搜索引擎 即时通讯 社会网络系统 网上银行,数据库技术回顾 计算机网络回顾,分布式数据库系统及其应用,分布式数据库系统设计的目标 分布式数据库系统设计的内容 分布式数据库的设计方法 数据分片设计 数据分布设计 DATAID-D方法 分布式数据库系统中数据的独立性与分布透明性 实例研究:飞机订票系统,分布式数据库系统设计,第3章,DDBS 设计目标,本地性或近地性,存储能力和费用,尽量减少通信次数和通信量,90/10准则,分片

37、和分布方案(本地和远程访问次数)择优,控制数据适当冗余,冗余增加了可靠性、可用性,提高了效率,维护数据一致性开销增加,工作负荷分布,各站点可以分担整个工作任务,本地性降低,DDBS设计,DDB设计,应用设计,全局模式设计,局部数据库设计,相关应用需求,各个应用的原发站点,各个应用在每个站点的激活频率,各个应用对要求访问数据对象的访问次数、类型和统计分布,分片和分布,DDBS 设计方法,自顶向下方法(重构法),混合方法,自底向上方法(组合法),3 分布式数据库设计方法,DDBS设计方法,组合法,剖析网络功能 剖析原有数据库系统 解决数据的一致性、完整性和可靠性 难度较大 通常是异构或者同构异质D

38、DBS,3 分布式数据库设计方法,重构法,根据实现环境和用户需求 按照DDBS的设计思想和方法 从总体设计做起,包括LDBS,重新建立一个DDBS 可有效解决数据一致性、完整性和可靠性问题。 通常是同构异质或同构同质DDBS,将现有的各种不同的数据库模式集成为全局模式. 三个问题 选择公用数据库模型来描述数据库的全局模式 把每个站点上的本地模式翻译成公用数据模型 把各站点上的本地数据模式集成为一公用的全局模式,自底向上设计方法要解决的问题,自底向上方法主要问题是构造一个全局模式(超视图). 把各站点上的数据库模式看成是全局模式的一个视图 这个问题就可看作是视图综合问题 概括分层结构支持视图综合

39、 经典方法就是生成三个实体:一个具有共同属性(超类型),两个具有不相交属性(子类型) 视图综合次序 一次把一个视图和全局模式进行综合,逐步构造起全局视图 通常,最好首先综合最大的或最重要的视图,然后跟着综合小的或者不重要的视图,构造全局模式问题和解决方法,班 机,机号,日期,可用座位,出入口,座位图,延期,班 机,机号,日期,可用座位,机型,座位图,识别相似性 模式命名相似性 模式结构相似性 不同Site上有相似应用, 使用各自DB的数据副本, 则这两Site之间有某些相似点. 识别冲突 命名冲突:同物异名(EMP,EMPLOYEE),异物同名 域差异 定标差异:计量单位不同(天、小时、分钟、

40、秒) 结构差异:同一对象有的用实体描述, 有的用属性描述. 处理操作期间不一致的数据策略(5种,p64-65),在自顶向下的数据分布设计中,必须要解决的第一个问题是数据的分片设计。 在数据分片设计时,是从分配的观点来看,根据具有“相同性质”的元组(在水平分片的情况下)或属性(在垂直分片的情况下)进行分组,使具有“相同性质(例如访问频率相同)”的元组或属性划分在一个组中,每组就构成一个片段 分片设计的基本目的是产生一个对全局数据合适的划分方案,将使用这种方案得到的数据片段作为分布式数据库中数据的分配和存储单位时,不但能够减少应用中的操作量,而且对于应用具有最大可能的本地性 但是,不是所有的全局数

41、据都必须进行分片,应考虑到有可能一个全局关系根本不需要分片。,假若有全局关系R 被分片为子关系(片段)集合 R = R1, R2, , Rn, 则 R满足 完整性 ?x R, RiR 必有 xRi ,i=1,2,n 可重构性 存在函数 g 使得R = g(R1, R2, , Rn) 即,R= Ri (水平分片),R= Ri (垂直分片) 不相交性 Ri Rj =空集,ij,i,j=1,2,n(水平分片) Ri Rj =主键属性,i,j=1,2,n(垂直分片),分片原则,分片方法,水平分片 垂直分片,职工关系 E (e#, name, loc, sal,) 查询: Qa: select * Qb

42、: select * from E from E where loc=Sa where loc=Sb and and .,举例,e# NM Loc Sal E,5,7,8,Sa,1000,Sally,Sb,2500,Tom,Sa,500,Joe,e# NM Loc Sal,e# NM Loc Sal,5,8,Sa,1000,Tom,Sa,500,Joe,7,Sb,2500,Sally,.,.,.,.,F,站点Sa,站点 Sb,举例,基本水平分片 以关系自身的属性性质为基础,执行“选择”操作,将关系分割成若干个不相交的片段。 R = R1, R2 R1 = loc=Sa(E) R2 = loc=

43、Sb(E),基本水平分片,若 R = R1, R2, , Rn, 则 完整性 对于每一个元组 tR, RiR 使得 tRi 不相交性 对tRi, Rj 使得 tRj, i j 可重构性 操作是 (可以忽略, 因为完整性就蕴含着) R = R1, R2, , Rn P = p1, p2, , pn是一简单谓词集合,为保证分片的正确性,P必须是: 完整的:同一分片中的任意两个元组被应用同样概率访问。 最小的:集合P中的所有谓词与应用密切相关。 具有完整性和最小性不是必要条件, 但是对于简化分配问题有好处,基本水平分片,例子 EMP ( E#, NAME, DEPT, JOB, SAL, TEL,

44、) DEPT=1,2 JOB=P, -P 假定,应用经常查询的内容是属于部门1且是程序员的职员。 则可能有的水平分段限定 P= DEPT=1 (不是完整的) P=DEPT=1, JOB=P (是完整的、最小的) P=DEPT=1, JOB=P, SAL500 (完整的,不是最小的),基本水平分片,如何保证分片原则,“手工”检查! e.g., R1 = loc=Sa E ; R2 = loc=Sb E 生成具有满足分段原则的限定谓词,基本水平分片,设有关系 E (e#,name,Loc,sal,A,), 查询使用的简单谓词(Ai Value)是: A5, Loc = Sa, Loc = Sb 下

45、一步: - 生成 “小项” 谓词 - 消除无用谓词 给定简单谓词集 Pr= p1, p2,. pn , 则“小项”谓词(minterm predicate)形式: p1* p2* pn* 这里 pk* 是 pk 或是 pk,谓词生成举例,(1) A5 Loc=SA Loc=SB (2) A5 Loc=SA (Loc=SB) (3) A5 (Loc=SA) Loc=SB (4) A5 (Loc=SA) (Loc=SB) (5) A5) Loc=SA Loc=SB (6) A5) Loc=SA (Loc=SB) (7) A5) (Loc=SA) Loc=SB (8) A5) (Loc=SA) (L

46、oc=SB),小项谓词选择,(9) (A5 Loc=SA Loc=SB (10) (A5 Loc=SA (Loc=SB) (11) (A5 (Loc=SA) Loc=SB (12) (A5 (Loc=SA) (Loc=SB) (13) (A5) Loc=SA Loc=SB (14) (A5) Loc=SA (Loc=SB) (15) (A5) (Loc=SA) Loc=SB (16) (A5) (Loc=SA) (Loc=SB),小项谓词选择,R2:5 A 10 Loc=SA R3:5 A 10 Loc=SB R6:A 5 Loc=SA R7:A 5 Loc=SB R10:A 10 Loc=S

47、A R11:A 10 Loc=SB,分片结果,注:无用段的消除依赖于应用的语义,e.g.: 如果 LOC 可以是 SA, SB, 则最终分段集合应该加上 R4:5 A 10 Loc SA Loc SB R8:A 5 Loc SA Loc SB R12:A 10 Loc SA Loc SB,小项选择率(minterm selectivity) 对某一给定小项谓词用户查询可能选择到的元组数 访问频率(Access frequency)用户应用访问数据的频率 小项访问频率可以通过用户查询频率获得,分片数量信息,例子 E(#, NM, LOC, SAL,) 有查询应用 Qa: select *Qb:

48、select * from Efrom E where LOC=Sa where LOC=Sb and and .,如何选择小项谓词举例,(1) Pr = R1 = E (2) Pr = LOC=Sa, LOC=Sb R2= loc=Sa E, loc=Sb E (3) Pr = LOC=Sa, LOC=Sb, Sal1000 R3= loc=Sa sal1000 E, loc=Sa sal1000 E, loc=Sb sal1000E, loc=Sb sal1000 E ,三种选择,Loc=Sa sal 1000,Loc=Sa sal 1000,Loc=Sb sal 1000,Loc=Sb sal 1000,R1,R3,R2,Qa: Select loc = Sa .,Qb: Select loc = Sb .,图示,Loc=Sa sal 1000,Loc=Sa sal 1000,Loc=Sb sal 1000,Loc=Sb sal 1000,R

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁