多层分布式数据库传输途径匹配方法-精品文档.docx-淘文阁

资源描述

《多层分布式数据库传输途径匹配方法-精品文档.docx》由会员分享，可在线阅读，更多相关《多层分布式数据库传输途径匹配方法-精品文档.docx（9页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、多层分布式数据库传输途径匹配方法摘要:传统多层分布式数据库数据的传输途径匹配准确度较低，对此提出基于时间序列索引的多层分布式数据库传输途径自动匹配方法。计算分布式数据库资源信息、初始信息序列、主要信息集合、信息属性权衡系数，整合数据库信息，建立BTEE索引，采用双向索引方式提取整合数据核心数据段，建立时间序列表，利用时间表对数据进行二次约束，对数据初始传输途径评估后与实际途径参数进行重合度比照，实现数据传输途径的自动匹配。实验数据表明，与传统传输途径匹配方式相比，设计的自动匹配方法完好数据传输途径匹配准确率提高24%，破损数据传输途径匹配准确率提高19%，具有实用优势性。关键词:分布式数据库;

2、传输途径;信息序列;信息集合;异构数据随着当代科技的飞速发展，我国社会经济构造、生产消费构造均发生了宏大变化。这些变化影响着我国国民生活的方方面面，尤其是近年来电子计算机技术的不断发展，导致我国计算机数据量与日俱增，传统的集中关系型数据库已经难以知足数据存储要求，多层分布式数据库应运而生。多层分布式数据库是当代市场上一款应用范围最广，功能强大的大型管理型数据库。该数据库具有极强的分布性、逻辑整理性。能够实现分布式计算、数据库透明访问，提高数据库传输负载，保证数据传输可靠性。此外，分布式数据库对于大型分布式数据和数据仓库具有较强的处理能力1。现阶段，我国市场上各大型企业和相关应用部门存储的应用数

3、据多为异构数据。这些数据在存储和传输经过中，很容易出现较大的信息缺失，而缺损的部分会掩盖数据的空间相关信息，使其在同一时间序列下的连续历史数据，很难做到百分之百数据匹配，进而难以知足数据使用要求。对于上述情况，必须设计更高精度的数据库传输途径自动匹配方法，提高数据传输完好度。但是在进行传输途径自动匹配方法的研究设计中，数据库多变量信息和时间序列的整合问题，成为制约其发展的重要因素，对此设计基于关联数据联合驱动理念，首先对数据库信息进行整合，以此提取数据时间序列，最后根据整合信息对数据源信息进行二次规划，实现数据库传输途径自动匹配2。1多层分布式数据库传输途径自动匹配方法设计1.1数据库信息整合

4、想要提高分布式数据库信息传输途径自动匹配的准确度，首先需要对数据库信息进行整合。选取数据库中数据源的原始数据及信息，提取主要特征集，获取信息特征数据的属性权重量，通过分布式数据库的信息累积分布函数进行数据信息整合，其具体步骤如下:假设wf为预设函数f(t)的数据传输截止频率，f(n)为函数f(t)的采样序列，利用公式(1)，能够表示需要整合的多层分布式数据库中的资源信息:式中，S0为公式的尺度函数;Sk为代表数据源信息在数据库高频段产生的数据误差项，dk为分布式数据代表采样值的数据源信息3。假设derty代表分布式数据库中采样率较低的数据源，gkker为需要进行数据整合的数据源的数据量。mgy

5、u为需要整合的数据源信息必须知足的数据整合约束条件。通过公式(2)能够获取数据源的初始信息序列:式中，dghk为数据源信息内在的相关性数据;ffil为数据源的单一性特征。假设通过dgjo和drjo表示具有最高一样性的两个同属性消息源矩阵，kmert异构数据信息源存储区域，eety为采样过失率。根据公式(3)能够直接求取分布式数据库数据源的主要信息集合。式中，vfip为数据库数据采样位置判决机制系数，mkk为分布式数据库数据源信息类型数据量4。设dgik为数据源信息数据的属性相关性，qwe为数据库特殊Forbenius范数。根据公式(4)能够获取分布式数据库数据源信息属性的权衡系数:式中，sdf

6、g为数据源信息联合稀疏的分散性阈值;fegh为数据源信息数据属性以及相关时空分布性。假设fh为数据参数秩的近似值，rrhj代表分布式数据库数据源信息属性权重系数的对应权的权重向量空间，提出数据库异构数据信息的累积分布函数:式中，wdgj为异构信息在进行整合时的最大周期误差，ser为数据源信息的采样周期5。根据公式上述公式，即可通过分布式数据源的主成分变化规律，进行分布式数据库内信息资源的整合，其整合表达式为:式中，ssfgh为分布式数据库数据信息源主成分的变化规律。根据上述公式，即可对分布式数据库进行数据资源整合，为后续数据库传输途径匹配提供基础。1.2获取信息时间序列在完成多层分布式数据路数

7、据资源整合后，为了提高后续数据传输匹配精度，设计采用数据核心成分重构法，对数据库整合数据资源信息时间序列的相空间，进行数据重构，建立时间索引表，获取信息时间序列。由于多层分布式数据库只负责异构数据的存储和读取，本身并没有明确的复杂性匹配方式，其固有的数据搜索引擎为KEYValue6。固然通过上述设计实现了数据库内异构数据的资源整合，但是KEYValue搜索存储方式只能提供数据基本表，这种基本表固然能够在数据底层提供搜索，但是并不是建立在存储引擎上的索引，而是存储本身索引。所以需要使用重构法，重新建立信息时间序列表。设计采用BTEE索引形式，通过数据库内的途径索引方位节点即pathID存储表获取

8、途径映射，直接在数据路信息节点存储表中获取数据节点信息。BTEE索引是一种顺序构造，如表1所示6。表1记录了BTEE索引pathID的存储顺序，根据表1信息，调用数据库存储引擎在pathID上的途径KEY，并建立有图形式的BTEE索引，如图1所示7。建立BTEE索引形式后，即可建立信息时间序列表。详细步骤如下:首先重新利用BTEE索引对重组后的数据进行分割，提取固有核心数据字段。由于我们在数据表如PathIDindex里建立的BTEE索引为唯一索引，且数据索引途径的KEY不会重复，所以能够通过提早割除KEY的形式，比拟能否具有重复节点8。BTEE索引采用双向搜索方式进行数据提取。所谓双向搜索就

9、算将数据搜索分解成为两个不同的数据索引经过。利用BTEE搜索引擎沿正反两个不同方向，对数据库数据节点交替搜索和数据分割。直到两个方向的搜索程序在某一个数据节点相遇为止。正向搜索就是沿着分布式数据库上层数据节点向底层数据进行搜索，反向搜索是从目的节点向上层搜索。正向搜索时，基于原目的数据库数据节点搜索到某一节点T时，假如变更BTEE索引形式，转化为反向搜索，则以正向搜索节点T为临时终端节点，进行数据索引，然后反复迭代9。直到正反两个方向上的搜索节点重合为止。搜索经过中需要重新定义数据库比拟函数，用于数据库Key的比拟10。由于分布式数据库数据信息包括数据类的Key，也有纯字符形式的Key，所以需

10、要重新定义数据数值和字符串，预设字符为:匹配时数据字符返回量为0，大于返回量为1小于返回量为1。双向搜索完毕后，就能够调用数据库存储引擎预设的数据接口，创立信息时间序列。由于信息时间序列表是以数据途径编号创立的，而节点条目TID值能够看做是途径编号的Key值，所以途径编号就算数据节点的数据存储位置。只需要在创立时间序列表时，指定分布式数据库的存储引擎在途径编号列中创立BTEE索引，就相当于创立了数据途径编号表，再根据途径编号表，对应指定存储引擎中的Key，即可重组数据时间序列，获取序列表11。1.3实现数据库传输途径自动匹配以上述获取的分布式数据库数据信息时间序列表为核心根据，利用途径传输时间

11、序列，对分布式数据库数据源信息的初始途径信息进行估计，提出分布式数据库信息向量和原始数据向量之间的途径比例关系，以此为根据进行传输途径的自动匹配12。设x(b)为多层分布式数据库数据源信息源中的第b个匹配信息，(m)为每个匹配数据信息源进行数据匹配时产生的一组不固定伪随机数据号码，利用上述经过求取的分布式数据库信息时间序列表serty为核心根据，利用公式(7)对时间序列表上的整合数据源信息进行二次约束:式中，kfrty为数据库内任意匹配数据的数据源信息Yser和数据流随机序列sfh的乘积。根据公式(7)对数据库数据进行二次规划后，设计以阿米霍步长准则，对匹配数据进行初始途径评估，其评估公式为:

12、式中，xcbklp为分布式数据库内信息的欠定状态系数，Qswert为数据库数据信息的负方向有效梯度;mswep为数据源信息进行途径匹配时的相关性参数阈值。根据公式(8)获取的评估参数，与实际途径参数进行重合匹配，假如匹配度超过阈值，则证实能够进行多层分布式数据库的数据途径传输，否则不能进行。其实际途径参数计算公式为:式中，khui为低阶数据库数据矩阵;swpp为数据源数据信息;mder为数据库内的数据源信息匹配奇异值的数据异常分布量;pgyu为数据源信息的匹配维度空间。hlpo为数据库匹配信息元素的集合向。以公式(9)求获得计算结果为根据，即可实现途径自行匹配。2实验数据分析多层分布式数据库信

13、息1315传输途径自动匹配准确率设计方法的有效性和操作价值需要通过实际数据信息传输效果进行确定。对此，进行实际数据传输途径匹配实验，分析传输经过数据。在MAT-LAB7.5环境下，搭建数据库传输途径匹配平台。数据样本采用国内某大型数据库提供的2016年以来国内卫星观测到的地质数据信息资料，设定实验组和比照组，令实验组选择传统数据途径匹配方法，令比照组选择新设计的传输途径自动匹配方法，将数据信息分别提供应两组，进行传输途径匹配。2.1数据完好度计算实验比照分析的第一阶段为完好数据比照。在实验前需要对数据完好性进行评价确认。从分布式数据库数据的信息丢失率和拟合度两方面，进行样本比对分析。验证明验用

14、数据能否为完好数据。设jko为数据样本类型，jkio为实验数据内个数据之间的关联性，ljko为源数据信息构造，则根据公式(10)能够计算实验数据的完好性。其fhui值越高，则证实信息数据完好度越高。实验用数据完好度必须到达98%以上。2.2完好数据传输途径匹配准确率比照将通过完好度计算的实验数据作为最终样本，划分为10个数据组。分别通过实验组和比照组进行数据传输途径匹配，并比照最终匹配度。其结果如图2所示。根据图2数据能够明晰地看出，实验样本10组数据库传输数据途径匹配经过中，实验组匹配均在70%以上，比照组实传输途径自动匹配准确率则处于50%到70%之间，实验组整体准确率明显高于比照组。经过

15、实际计算能够确定，实验组对于完成数据传输途径匹配准确率提高了24%，具有较强优势性。2.3破损数据传输途径匹配准确率比照由于异构数据在存储经过中很容易出现数据破损，对于破损数据传输途径的自动匹配同样是其整体优势性的重要参照指标。对此，重新提取实验样本，所有数据均换为破损数据，进行数据传输途径自动匹配，其整体数据比照结果如表2所示。根据表2数据能够看出，在7组实验目的数据传输途径的自动匹配中，实验组数据匹配量和对应匹配精度同样高于比照组。能够进一步证实，设计的多层分布式数据库传输途径自动匹配方法能够有效提高数据途径匹配准确度。3结束语分布式数据库的整合和应用是将来数据管理的趋势，也是核心技术阵地。对于该领域的研究创新，符合当前数据管理行业的大方向。对此，针对传统分布式数据库传输途径自动匹配方法信息匹配准确率较低的问题，基于数据时间序列，提出新型数据途径自动匹配方法。设计通过数据整合和建立独立索引，提取核心字段，再进行匹配，能够有效提高匹配的准确度。在将来研究中，能够从实验数据样本入手，通过研究更复杂的数据情况，进一步提高数据整合度，进而加强途径自动匹配精度。

展开阅读全文