《数据库新技术幻灯片.ppt》由会员分享,可在线阅读,更多相关《数据库新技术幻灯片.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据库新技术第1页,共53页,编辑于2022年,星期六主要内容7.1 面向对象数据库系统 7.2 分布式数据库系统 7.3 工程数据库 7.4 XML数据库 7.5 其他数据库 7.6 数据仓库 7.7 知识发现 第2页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统面向对象数据模型是依据面向对象方法所建立的数据模型,其中包括数据模式(数据结构)、建立在模式上的数据操作和数据约束。数据模式 数据操作 数据约束 7.1.1 面向对象数据模型 第3页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统与传统数据模型比较,面向对象数据模型有以下几个特点:面向对象模型是一种层次
2、式的结构模型 面向对象数据模型是将数据与操作封装于一体的结构方式 面向对象数据模型具有构造多种复杂抽象数据类型的能力 面向对象数据模型具有不断更新结构的模式演化能力7.1.1 面向对象数据模型 第4页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统OODBMS由3个主要部分组成,它们是类管理、对象管理和对象控制。类管理对象管理 对象控制 7.1.2 面向对象数据库管理系统第5页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统1989年12月,在第一届演绎、面向对象数据库国际会议提出了OODBS应该具备的主要特征。这些特征分为三组:必备的(被称作面向对象的数据库系统所
3、必须满足的特性)、可选的(为了使系统更完善可添加的而非必备的特性)和开放的(设计人员可以选择的特性)。7.1.3 面向对象数据库系统的概念与特征第6页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统20世纪80年代成立的ODMG(Object Data Management Group),在1993年形成工业化的OODB标准ODMG1.0,1997年推出的ODMG2.0ODMG工业标准对C+的扩展主要包括C+对象定义语言(Object Definition Language,ODL)和C+对象操作语言(Object Manipulate Language,OML),其中,OML又
4、分为对象查询语言(OQL)和对象控制语言(OCL)。7.1.4 面向对象数据库系统的查询第7页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统ODBS中采用了多粒度加锁,锁类型除了共享锁(S锁)和排它锁(X锁),还引入了一种意向锁(Intentlock)。意向锁有意向共享锁、意向排它锁和共享意向排它锁之分。7.1.5 面向对象数据库系统的并发控制第8页,共53页,编辑于2022年,星期六7.1 面向对象数据库系统7.1.5 面向对象数据库系统的并发控制表7-1-锁类型的相容性矩阵SXISIXSIXSYNYNNXNNNNNISYNYYYIXNNYYNSIXNNYNN第9页,共53页
5、,编辑于2022年,星期六7.2 分布式数据库系统分布式数据库是计算机网络环境中各场地(Site)或节点(Node)上数据库的逻辑集合。按数据冗余分类按全局数据库的构成分类 按本地数据库的配置方式分类 按本地数据库的数据是否全部集成到全局数据库中分类 7.2.1 分布式数据库及其分类第10页,共53页,编辑于2022年,星期六7.2 分布式数据库系统数据独立性与位置透明性 集中和自治相结合 支持全局数据库的一致性和可恢复性 复制透明性 易于扩展性 7.2.2 分布式数据库的特点第11页,共53页,编辑于2022年,星期六7.2 分布式数据库系统对等型分布数据库的分级结构。7.2.3 分布式数据
6、库的分级结构第12页,共53页,编辑于2022年,星期六7.2 分布式数据库系统多数据库系统的分级结构 7.2.3 分布式数据库的分级结构第13页,共53页,编辑于2022年,星期六7.2 分布式数据库系统无全局概念模式的参考结构 7.2.3 分布式数据库的分级结构第14页,共53页,编辑于2022年,星期六7.2 分布式数据库系统联邦式结构 7.2.3 分布式数据库的分级结构第15页,共53页,编辑于2022年,星期六7.2 分布式数据库系统数据分布包括分割和分配两个方面,先从逻辑上将全局概念模式,即全局关系模式,划分成若干逻辑片断(子关系)-分割再按一定的冗余度将片断分配到各个节点上,这时
7、逻辑片断就成为具体的物理片断-分配。7.2.4 分布式数据库的数据分布第16页,共53页,编辑于2022年,星期六7.3 工程数据库工程数据库(Engineering Database)是存储、管理和使用工程设计所需数据的数据库,是将工程设计方法、人工智能技术与数据库技术相结合发展起来的智能化的CAD/CAM集成系统,适合于CAD/CAM、计算机集成制造(CIM)等工程应用领域。7.3.1 工程数据库基本概念第17页,共53页,编辑于2022年,星期六7.3 工程数据库对象的表达和处理 数据技术 模式变化 长事务及并发控制 7.3.2 工程数据库与传统数据的比较第18页,共53页,编辑于202
8、2年,星期六7.3 工程数据库7.3.3 工程数据库体系结构第19页,共53页,编辑于2022年,星期六7.3 工程数据库长事务指的是那些持续事件长的事务,典型的长事务其持续时间从几个小时到几天不等。在解决长事务等待方面可采用的方法有版本法、成组事务、软锁等几种技术。7.3.4 长事务管理第20页,共53页,编辑于2022年,星期六7.4 XML数据库XML(Extensible Markup Language)即可扩展标记语言,是一种基于SGML(Standard Generalized Markup Language,标准通用标记语言)的简单灵活的语言。XML是一种跨平台标准,可运行在任何
9、平台和操作系统上。XML文档就是指由XML标记语言所定义的符合XML规范的文本文档。7.4.1 XML技术第21页,共53页,编辑于2022年,星期六7.4 XML数据库DTD(Document Type Definition,文档类型定义)是用来定义文档所具有的逻辑结构的,是XML文档的数据模型。DOM(Document Object Model,文档对象模型)是访问和维护HTML和XML文档的应用程序接口。XPath(XML Path Language)是一种对XML文档的内容进行定位、检索的语言,是后续更强大的数据检索语言如XQuery的基础。XQuery是一种将查询表示成表达式的功能语
10、言,它支持几种表达式,因此,它的查询可以有几种不同的形式。7.4.1 XML技术第22页,共53页,编辑于2022年,星期六7.4 XML数据库XML数据库是一种Web数据库,它是可以对XML文档进行存取管理和数据查询的数据库,是一个能够在应用中管理XML数据和文档的数据库系统。XML数据库是一组XML文档的集合,并且是持久的和可操作的;有专门的DBMS管理(不是XML文件系统);文档都是有效的(即符合某一模式);文档的集合可能基于多个模式文件(即文件扩展名为.xsd),多个模式文件之间可能有语法和语义上的相互联系。7.4.2 XML数据库第23页,共53页,编辑于2022年,星期六7.4 X
11、ML数据库原生XML数据库 支持XML的数据库 混合XML数据库 7.4.3 XML数据库分类第24页,共53页,编辑于2022年,星期六7.4 XML数据库外层主要提供了一个可以给用户和应用程序查询、修改的接口概念层涉及XML数据的组织、存储粒度的设计等,然后在数据模型中提供操作来存储、查询和操作数据。内层主要是提供XML文档的数据结构,包括元素、属性、字符数据表等最基本的组成单元,XML数据库的灵活性也主要表现在这一级 7.4.4 XML数据库管理系统第25页,共53页,编辑于2022年,星期六7.4 XML数据库7.4.4 XML数据库管理系统第26页,共53页,编辑于2022年,星期六
12、7.5 其他数据库模糊数据库指能够处理模糊数据的数据库。模糊数据库的研究与实践就是为了解决模糊数据的表达和处理问题,使得数据库描述的模型能更自然、更贴切地反映客观世界。把不完全性、不确定性、模糊性引入数据库系统中,从而形成模糊数据库。7.5.1 模糊数据库第27页,共53页,编辑于2022年,星期六7.5 其他数据库当前模糊数据库系统的主要研究内容包括:模糊数据库的形式定义;模糊数据库的数据模型(如属性值模糊的FVRDM、元组值模糊的FTRDM);模糊数据库语言设计;模糊数据库设计方法及模糊数据库管理系统的实现等。7.5.1 模糊数据库第28页,共53页,编辑于2022年,星期六7.5 其他数
13、据库演绎的含义是根据已知的事实和规则进行推理,回答用户提出的各种问题。演绎数据库是指具有演绎推理能力的数据库。演绎数据库可包含三方面内容;实数据(事实)、规则及虚数据。7.5.2 演绎数据库第29页,共53页,编辑于2022年,星期六7.5 其他数据库7.5.2 演绎数据库第30页,共53页,编辑于2022年,星期六7.5 其他数据库模糊演绎数据库系统融合模糊信息处理与推理技术,特别是模糊推理技术后的数据库管理系统,在模糊数据库系统中加入模糊推理机制而来。模糊演绎数据库模型是模糊逻辑数据模型的一种特例。7.5.3 模糊演绎数据库第31页,共53页,编辑于2022年,星期六7.5 其他数据库空间
14、数据库系统是支持空间数据管理,面向地理信息系统、制图、遥感、摄影测量、测绘和计算机图形学等学科的数据库系统。复杂性。动态性。海量化。运算符不闭合。7.5.4 空间数据库第32页,共53页,编辑于2022年,星期六7.5 其他数据库统计与科学数据库系统是指面向统计分析与科学研究而建立的数据库系统。统计数据库要求能对其中的数据进行统计分析,如求数据的平均值、最大值、最小值、总和等。统计数据库中的数据可分为两类,即微观数据和宏观数据。科学数据库可分为文献数据库、数值数据库和管理数据库等 7.5.5 统计与科学数据库第33页,共53页,编辑于2022年,星期六7.5 其他数据库时态和历史数据库系统是将
15、数据的时间属性引入数据模型,从而支持有效时间和事务时间,支持时态查询处理的数据库系统。历史数据库就是一种时态数据库,支持历史数据的查找和操作。对时态数据库的研究主要集中在时态数据模型和查询语言,时态查询处理和支持时间属性处理的索引方法上。7.5.6 时态和历史数据库第34页,共53页,编辑于2022年,星期六7.5 其他数据库实时数据库是数据库技术结合实时处理技术产生的。它适用于处理不断更新的快速变化的数据及具有时间限制的事务处理。实时数据库RTDB(Real-Time Data Base)是数据和事务都有定时特性或显示的定时限制的数据库。实时数据库的一个重要特性就是实时性,包括数据实时性和事
16、务实时性。7.5.7 实时数据库第35页,共53页,编辑于2022年,星期六7.5 其他数据库主存数据库系统是将所管理的全部数据或大部分数据存于物理内存,从而获得非常高的存取速度的数据库系统。近年来,存储芯片集成度不断提高,价格不断低廉,存储容量不断增大,在主存中存放越来越大的数据库已成可能。7.5.8 主存数据库第36页,共53页,编辑于2022年,星期六7.5 其他数据库移动数据库(Mobile Database)是指在移动计算环境中的分布式数据库,其数据在物理上分散而在逻辑上集中 涉及数据库技术、分布式计算技术、移动通信技术等多个学科领域 7.5.9 移动数据库第37页,共53页,编辑于
17、2022年,星期六7.5 其他数据库7.5.9 移动数据库第38页,共53页,编辑于2022年,星期六7.5 其他数据库与分布式数据库系统相比,移动数据库系统具有如下特点:移动性与位置相关性。频繁的断接性。网络条件的多样性。系统规模庞大。系统的安全性和可靠性较差。资源的有限性。网络通信的非对称性。7.5.9 移动数据库第39页,共53页,编辑于2022年,星期六7.6 数据仓库数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于
18、支持管理决策。数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库 数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改 7.6.1 什么是数据仓库第40页,共53页,编辑于2022年,星期六7.6 数据仓库数据仓库拥有以下四个特点:面向主题。集成的。相对稳定的。反映历史变化。7.6.1 什么是数据仓库第41页,共53页,编辑于2022年,星期六7.6 数据仓库7.6.1 什么是数据仓库表7-2操作型数据库与数据仓库之间的区别对比内容数据库数据仓库数据内容与业务相关的操作型数据;企业每天运作产生的细节性数据历
19、史的、存档的、归纳的、计算的数据;决策相关信息数据目标面向业务操作程序、重复处理面向主题域、管理决策分析应用数据特性动态变化、按字段更新静态、不能直接更新、只定时添加数据模型关系层次结构关系的、多维的数据访问经常是随机地读写操作一般是只读操作使用频率高中到低数据访问量每个事务只访问少量记录有的事务可能要访问大量记录关系结构3NF(第三范式)星型/雪花/混合第42页,共53页,编辑于2022年,星期六7.6 数据仓库数据源 数据的存储与管理 OLAP服务器 前端工具 7.6.2 数据仓库的体系结构第43页,共53页,编辑于2022年,星期六7.6 数据仓库7.6.2 数据仓库的体系结构第44页,
20、共53页,编辑于2022年,星期六7.6 数据仓库数据仓库提供了标准的报表和图表功能 数据仓库支持多维分析。数据仓库是数据挖掘技术的关键基础。总之,数据仓库的主要作用是通过多维模式结构、快速分析计算能力和强大的信息输出能力为决策分析提供支持。7.6.3 数据仓库的作用第45页,共53页,编辑于2022年,星期六7.7 知识发现数据库中发现知识(KDD)一词首次出现在1989年8月在美国底特律召开的第十一届国际联合人工智能学术会议专题讨论会上。1989年到1994年举行了四次KDD专题讨论会。1995年在加拿大蒙特利尔市召开了第一届知识发现与数据挖掘的国际学术会议 1998年建立了新的学术组织A
21、CM-SIGKDD,即ACM下的数据库中的知识发现专业组。7.7.1 KDD的产生第46页,共53页,编辑于2022年,星期六7.7 知识发现KDD是从数据集中识别出有效的、新颖的、潜在有用的、以及最终可理解的模式的非平凡过程。数据集 模式 过程 有效性 新颖性 潜在有用性 最终可理解性 7.7.2 KDD的相关概念第47页,共53页,编辑于2022年,星期六7.7 知识发现数据分类。数据聚类。衰退和预报。关联和相关性。顺序发现。描述和辨别。时间序列分析。7.7.3 KDD的基本任务第48页,共53页,编辑于2022年,星期六7.7 知识发现数据库。文本。Web信息。空间数据。图像和视频数据。
22、7.7.4 KDD的对象第49页,共53页,编辑于2022年,星期六7.7 知识发现知识发现方法主要包括统计方法、机器学习方法、神经网络方法和数据库方法等。统计方法 机器学习法 神经网络法 数据库方法 7.7.5 KDD的方法第50页,共53页,编辑于2022年,星期六7.7 知识发现 多处理阶段模型 7.7.6 KDD的处理过程第51页,共53页,编辑于2022年,星期六7.7 知识发现以用户为中心的处理模型 7.7.6 KDD的处理过程第52页,共53页,编辑于2022年,星期六7.7 知识发现金融 医疗保健 市场业 制造业 工程与科学 其它 7.7.7 KDD的应用第53页,共53页,编辑于2022年,星期六