《分布式数据库的实现.docx》由会员分享,可在线阅读,更多相关《分布式数据库的实现.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、分布式数据库的实现(内蒙古经贸信息服务中心,内蒙古 呼和浩特 010110)摘 要:文章以某保险公司的业务处理系统为例,具体探讨了分布式查询数据库系统,并给出了实现方法。关键词:分布式;查询系统;探讨;实现中图分类号:G252.7 文献标识码:A 文章编号:10176921(2022)08004802分布式数据库系统中的查询处理较集中式数据库困难,本文结合某保险公司的业务处理系统(同构分布式数据库系统)探讨分布式查询及其实现。1 系统概述从全局应用的角度动身,将各分支机构的数据库自下而上构成分布式数据库系统(同构),实现全局数据的完整性和一样性,各营业机构仍旧存放本机构的数据,总公司的数据库则
2、存放全部业务数据,并对数据进行完整性和一样性的检查,这种做法虽然有肯定的数据冗余,但在不同场地存储同一数据的多个副本,能提高系统的牢靠性和可用性,也提高了局部应用的效率,削减了通讯代价。该分布式数据库系统可以在对当前机构影响最小的状况下进行扩充,增加新的营业机构时只需增加一个节点就可以了,同时也使得各处理机之间的相互干扰降到最低。740)this.width=740 border=undefined onmousewheel=return zoom_img(event,this)2 系统查询的探讨与设计该业务处理系统是一个同构的分布式数据库系统,其查询也就是分布式查询的一般处理过程如下
3、图所示:740)this.width=740 border=undefined onmousewheel=return zoom_img(event,this)分布式查询处理的可选方案许多,这就有一个查询优化的问题。分布式数据库系统中存在两类查询优化问题,一是在局部数据库上的查询优化,由局部DBMS执行,称为局部查询优化(在本例中,局部查询优化由局部DBMS完成);二是在整个分布式数据库中的查询优化,称为全局查询优化。保证分布式数据库系统全局查询有较好的效率通常是以下面两条为基础的DDBMS分裂成概念数据库,使得数据存放到离其应用点最近的节点。这个特征称作数据的局部性,这有两个潜在的优
4、势;由于每个节点只处理数据库的一个部分,这样CPU和IO服务的竞争就不像集中式数据库那样严峻;而且局部性还削减了远程访问的延迟,这种延迟常发生在广域网中。大多数分布式DBMS是结构化的,这样就便于从数据的分布中获得最大收益。削减竞争和削减通讯延迟的好处只有通过数据的合理分布才能得到。支持DDBMS全局查询有较好效率的其次条是分布式系统的固有并行机制可用于内部查询和内在查询的并行化。内部查询并行化是多个查询同时执行的结果。内在查询并行化是将单个查询分解成多个子查询以便每个在不同的节点来执行,这样即可同时访问分布式数据库的不同部分,提高查询效率。2.1 数据分布如上所述,为分布式查询的全局优化,必
5、需保证其数据的合理分布。分布式数据库系统可以通过复制、分片和复制+分片三种方式存储数据,因为各数据库之间存在肯定的数据冗余,又存在着差异,我们采纳复制+分片的方式进行数据存储。在本例中,将关系分片,有利于按用户需求组织数据的分布,目前的分片方式有水平分片、垂直分片、导出分片、混合分片等四种。我们依据不同的数据关系采纳不同的分片方式:2.1.1 在总公司与分支营业机构的数据关系中,由于分支机构的数据是总公司业务数据的子集,我们采纳水平分片的方式,通过并运算实现关系的重构。2.1.2 在总公司数据库服务器与Web数据库服务器的数据关系中,数据是根据其应用功能来划分的,所以我们采纳垂直分片的方式。详
6、细的数据安排根据分公司只保存与分公司相关的数据,总公司保存完整数据的原则实施。这样安排数据的优点是:由于数据存放在常常运用的地点(比如与某分公司有关的数据在其本地服务器中就可以获得),就削减了响应时间和网络通讯代价。在分布式数据库系统中,数据副本的存在,客观上起到了增加数据牢靠性的作用。另外,由于总公司保存了系统的完整数据,所以便于进行面对全公司的统计、分析工作。2.2 查询的实现根据分布式查询的目标和步骤,采纳基于集合划分的分布式数据库查询分解算法(目前的数据库大多是关系型数据库系统,故适用于集合划分理论),该算法的思想如下:2.2.1 对于全局查询的每一个属性,找到其相应的object划分
7、;2.2.2 取一个包含步骤(1)中全部划分的最细划分;2.2.3 对应每一个划分得到一个子查询。结合某保险公司业务处理系统中的实例,说明查询分解的实现:首先,假如数据在不同的LDB中没有相交,查询分解很明显就是用相应的LDB名称(表名称和属性名称)代替全局名称。以单证管理为例,假设A分公司有单证管理关系(S)如下:740)this.width=740 border=undefined onmousewheel=return zoom_img(event,this) 对S做如下查询:SELECT * FROM SWHERE 公司代码LIKE 015023AND 作废单数量>10,
8、明显,该查询的目标数据只在片段S1中,则我们可以干脆用局部表名S1代替全局表名S,将上述查询转换为:SELECT * FROM S1。WHERE 公司代码LIKE 015023AND 作废单数量>10。其次,当不同LDB中存在数据相交时,以个人代理人基本信息表Person(pNo,pName,pSex,pAge,pClass,pCode)为例,对其进行垂直分片,使其分为P1(pNo,pName,pSex,pAge,pClass)和P2(pNo,pName,pClass,pCode)两个局部模式,明显两个局部模式是存在相交的。假设P3由P1和P2一般化得到,则一般化关系模式和外连接关系模式
9、如下:740)this.width=740 border=undefined onmousewheel=return zoom_img(event,this) 考虑对关系P4的全局查询:SELECT P4.nameFROM P4WHERE P4.pClass LIKE 助理 AND P4.pAge>35则最好的划分是基于pClass的划分。分解成如下子查询:对object(P1)object(P2):SELECT P1.pNameFROM P1WHERE P1.pClass LIKE 助理 AND P1.pAge>35 AND P1.pNo NOT IN (SELECT P
10、2.pNo FROM P2)对object(P1)object(P2):SELECT P2.pNameFROM P2,P1WHERE P2.pClass LIKE 助理AND P2.pAge>35AND P2.pNo=P1.pNo对object(P2)object(P1):由于P4.pAge=NULL,所以关于它的子查询被丢弃。有些状况须要多层次的查询分解才能达到要求,即将得到的子查询进一步分解,以使子查询涉及的查询范围仅为一个数据库服务器。例如考虑对objcet(P1)object(P2)的子查询,还可以分解为两个子查询,一个为“SELECT P2.pNo FROM P2”;另一个为“
11、P1.pNo NOT IN X”,其中X为前一个子查询的查询结果。通过查询分解,得到一系列只涉及一个数据库服务器的子查询语句,从而可以完成全局查询。上述方法事实上是对现实世界中的对象(object)做的一个完全划分,从而避开了数据的冗余,使查询分解既简洁,又为后期的查询优化供应了良好的基础。3 结束语本文所探讨的同构分布式数据库系统的查询与实现是在分析、总牢固例的基础上,结合分布式数据库与计算机技术发展的趋势提出的,值得借鉴并进一步发展下去。参考文献1 陶世群.分布式数据库系统中的设计方法和技术J.吉首高校学报,2001,(03).2 丛丽晖,夏秀峰,富刚,等.NDBMS的查询优化技术探讨J.微处理机,2003,(01).3 郑宇,周广生.分布式数据库中数据安排策略及实例探讨J.计算机工程与应用,19101,(12).4 张敬伟,周娅.基于集合划分的分布式数据库查询分解算法J.桂林电子工业学院学报,2003,(01). 第8页 共8页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页