《数据库(第一章).ppt》由会员分享,可在线阅读,更多相关《数据库(第一章).ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据库原理与技术主讲教师:陈朵玲第第1章章 数据库的基本概念 1.1 数据库管理的历史变迁数据库管理的历史变迁 1.2 数据模型数据模型 1.3 数据库系统结构数据库系统结构 1.4 数据库系统的组成数据库系统的组成 1.5 数据库新技术数据库新技术1.1 数据库管理的历史变迁磁盘容量的发展磁盘容量的发展磁盘容量的发展磁盘容量的发展数据管理技术的发展经历了数据管理技术的发展经历了人工管理、文件系统、人工管理、文件系统、数据库阶段数据库阶段和和高级数据库阶段高级数据库阶段。时间时间(年)(年)1956195619651965197119711978197819811981198519851995
2、199520032003容量容量(MBMB轴轴)5 5303010010060060012001200500050001000010000180000180000一、人工管理阶段在人工管理阶段(在人工管理阶段(2020世纪世纪5050年代中期以前),计年代中期以前),计算机主要用于科学计算,其他工作还没有展开。算机主要用于科学计算,其他工作还没有展开。外部存储器只有磁带、卡片和纸带等,还没有磁外部存储器只有磁带、卡片和纸带等,还没有磁盘等字节存取存储设备。软件只有汇编语言,尚盘等字节存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理的方式基本上无数据管理方面的软件。数据处理的方式
3、基本上是批处理。是批处理。人工管理阶段的数据管理有下列特点:人工管理阶段的数据管理有下列特点:人工管理阶段的数据管理有下列特点:人工管理阶段的数据管理有下列特点:数据不保存。数据不保存。没有管理数据的软件系统,即数据和程序不具有独没有管理数据的软件系统,即数据和程序不具有独立性。立性。基本上没有文件概念。基本上没有文件概念。数据是面向应用的数据是面向应用的 用户1应用程序1数据组1应用程序2数据组2用户2应用程序3数据组3用户m应用程序n数据组n二、文件系统阶段在这一阶段(20世纪50年代后期至60年代中期),计算机不仅用于科学计算,还用于信息管理。随着数据量的增加,数据的存储、检索和维护问题
4、成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取存储设备。软件领域出现了高级语言和操作系统。操作系统中的文件系统是专门管理外存的数据管理软件。数据处理的方式有批处理,也有联机实时处理。用户用户1应用程序应用程序1数据文件数据文件1应用程序应用程序2数据文件数据文件2用户用户2应用程序应用程序3数据文件数据文件3用户用户m应用程序应用程序n数据文件数据文件n文文件件管管理理系系统统文件系统阶段的数据管理有以下特点:文件系统阶段的数据管理有以下特点:文件系统阶段的数据管理有以下特点:文件系统阶段的数据管理有以下特点:数据存在文件中,文件可长期保存在外存。
5、数据存在文件中,文件可长期保存在外存。程序和数据有了一定的独立性。程序和数据有了一定的独立性。文件多样化。文件多样化。数据的存取基本上以记录为单位。数据的存取基本上以记录为单位。随着数据管理规模的扩大,数据量急剧增加,文件随着数据管理规模的扩大,数据量急剧增加,文件随着数据管理规模的扩大,数据量急剧增加,文件随着数据管理规模的扩大,数据量急剧增加,文件系统显露出三个缺陷:系统显露出三个缺陷:系统显露出三个缺陷:系统显露出三个缺陷:数据冗余(redundancy)数据独立性差数据联系弱(poor data relationship)三、数据库阶段数据管理技术进入数据库阶段的标志是数据管理技术进入
6、数据库阶段的标志是数据管理技术进入数据库阶段的标志是数据管理技术进入数据库阶段的标志是2020世纪世纪世纪世纪6060年代末的三件大事:年代末的三件大事:年代末的三件大事:年代末的三件大事:19681968年美国年美国IBMIBM公司推出层次模型的公司推出层次模型的IMSIMS系统系统 。19691969年美国年美国CODASYLCODASYL组织发布了组织发布了DBTGDBTG报告,总报告,总结了当时各式各样的数据库,提出网状模型。结了当时各式各样的数据库,提出网状模型。19701970年美国年美国IBMIBM公司的公司的E.F.CoddE.F.Codd 连续发表论文,连续发表论文,提出关系
7、模型,奠定了关系数据库的理论基础。提出关系模型,奠定了关系数据库的理论基础。用户用户1应用程序应用程序1应用程序应用程序2用户用户2应用程序应用程序3用户用户m应用程序应用程序n数数据据库库管管理理系系统统数据库数据库数据库阶段的数据管理具有以下特点:数据库阶段的数据管理具有以下特点:整体数据的结构化。数据独立性高。数据的共享性高,冗余度低,易扩充。提供以下四方面的数据控制功能:数据库的并发控制;数据库的并发控制;数据库的恢复;数据库的恢复;数据的完整性;数据的完整性;数据安全性。数据安全性。1.2 数据模型 数据模型是客观事物某些特征的数据抽象和模拟。在数据库中普遍采用数据模型这个工具来抽象
8、表示和处理客观事物的数据特征和信息。一、数据模型的分类一、数据模型的分类 现实世界现实世界(事物、事物性质,事物间联系)(事物、事物性质,事物间联系)抽抽象象化化信息世界信息世界(实体、实体属性,实体间联系)(实体、实体属性,实体间联系)概念模型描述概念模型描述数据世界数据世界 记录、数据项,关系间的关联)记录、数据项,关系间的关联)数据模型描述数据模型描述二、概念模型基本概念基本概念实体(Entity):实体是客观事物的反映,既可以是实 际存在的对象,也可以是某种概念。属性(Attribute):实体有很多特性,每一个特性称为属性。每一个属性有一个值域,其类型可以是整数型、实数型、字符串型等
9、。实体集(entity set):性质相同的同类实体的集合,称为实体集。实体型(Entity Type):实体集的名及其所有属性名的集合,称为实体型。实体标识符(identifier):能惟一标识实体的属性或属性集,称为实体标识符。也称为关键码(key),或简称为键。域(Domain):一个属性的取值范围就是这个属性的域。实体的联系(Relationship)一对一联系:实体集A中每个实体至多和实体集B中的一个实体有联系,反之亦然,那么A和B的联系称为“一对一联系”,记为“1:1”。一对多联系:实体集A中每个实体可以与实体集B中任意个实体间有联系,而B中每个实体至多和A中一个实体有联系,那么称
10、A对B的联系是“一对多联系”,记为“1:N”。多对多联系:实体集A中每个实体与实体集B中任意个实体有联系,反之亦然,那么称A和B的联系是“多对多联系”,记为“M:N”。实体型实体型B实体型实体型A联系联系名名实体型实体型B实体型实体型A联系联系名名实体型实体型B实体型实体型A联系联系名名111nmn表示表示例例:职职 工工部部 门门工工 作作职职 工工职职 工工拥拥 有有工工 资资参参 加加项项 目目1n11mn三、结构数据模型(逻辑模型)数据模型是数据库系统的核心和基础,任何DBMS都支持一种数据模型。任何一种数据模型都三部分内容构成任何一种数据模型都三部分内容构成 数据结构数据结构 数据操
11、作及操作规则数据操作及操作规则 完整性约束完整性约束 主要的数据模型:主要的数据模型:层次模型(Hierarchical Model)网状模型(Network Model)关系模型(Relational Model)用树型(层次)结构表示实体类型及实体间联系的用树型(层次)结构表示实体类型及实体间联系的数据模型称为数据模型称为层次模型层次模型(hierarchical modelhierarchical model)。层次模型的特点层次模型的特点是记录之间的联系通过指针来实现,是记录之间的联系通过指针来实现,查询效率较高。与文件系统的数据管理方式相比,查询效率较高。与文件系统的数据管理方式相比
12、,层次模型是一个飞跃,用户和设计者面对的是逻辑层次模型是一个飞跃,用户和设计者面对的是逻辑数据而不是物理数据,用户不必花费大量的精力考数据而不是物理数据,用户不必花费大量的精力考虑数据的物理细节。逻辑数据与物理数据之间的转虑数据的物理细节。逻辑数据与物理数据之间的转换换由由DBMSDBMS完成。完成。层次模型有两个缺点:层次模型有两个缺点:一是只能表示一是只能表示1:N1:N联系,虽然联系,虽然系统有多种辅助手段实现系统有多种辅助手段实现M:NM:N联系但较复杂,用户不联系但较复杂,用户不易掌握;二是由于层次顺序的严格和复杂,引起数易掌握;二是由于层次顺序的严格和复杂,引起数据的查询和更新操作
13、很复杂,因此应用程序的编写据的查询和更新操作很复杂,因此应用程序的编写也比较复杂。也比较复杂。1 1、层次模型、层次模型用有向图结构表示实体类型及实体间联系的数据模用有向图结构表示实体类型及实体间联系的数据模用有向图结构表示实体类型及实体间联系的数据模用有向图结构表示实体类型及实体间联系的数据模型称为型称为型称为型称为网状模型(网状模型(网状模型(网状模型(network modelnetwork modelnetwork modelnetwork model)。网状模型的特点网状模型的特点网状模型的特点网状模型的特点是记录之间联系通过指针实现,是记录之间联系通过指针实现,是记录之间联系通过指
14、针实现,是记录之间联系通过指针实现,M:NM:NM:NM:N联系也容易实现(一个联系也容易实现(一个联系也容易实现(一个联系也容易实现(一个M:NM:NM:NM:N联系可拆成两个联系可拆成两个联系可拆成两个联系可拆成两个1:N1:N1:N1:N联系)联系)联系)联系),查询效率较高。,查询效率较高。,查询效率较高。,查询效率较高。网状模型的缺点网状模型的缺点网状模型的缺点网状模型的缺点是数据结构复杂和编程复杂。是数据结构复杂和编程复杂。是数据结构复杂和编程复杂。是数据结构复杂和编程复杂。2、网状模型、网状模型3、关系模型数据结构数据结构在关系模型中,数据的逻辑结构是一张张二维表。EnoEnam
15、eSexAge1002胡一民胡一民男男381004王王爱爱民民男男601005张张小小华华女女501010宋文彬宋文彬男男361011胡民胡民男男341015黄黄晓晓英英女女261022李李红卫红卫女女271031丁丁为为国国男男24关系模型关系模型 employee(eno,ename,sex,age)关系关系属性属性 域(域(Domain):属性取值的范围属性取值的范围元组元组分量分量分量分量候选码:候选码:候选码:候选码:若关系中某一属性组的值能够唯一的标识一个元组,而它的任意真子集均不能唯一的标识该元组,则称该属性组为候选码。包含在任意一个候选码中的属性称谓主属性;不包含在任何候选码中
16、的属性称为非主属性。主码(主码(主码(主码(KeyKey):):):):若一个关系有多个候选码,则选定其中的一个为主码。在最简单的情况下,候选码只含有一个属性,称为单码。在最极端的情况下,关系的所有属性是这个关系的候选码,成为全码。例:例:Student(sno,sname,ssex,sage,saddr)侯选码:侯选码:sno (sname,saddr)主码:主码:snoSnoSnameSsexSageClno2000101李勇李勇男男20003112000102刘刘诗诗晨晨女女19003112000103王一王一鸣鸣男男20003122000104张张婷婷婷婷女女2100312200110
17、1李勇敏李勇敏女女19013112001102贾贾向向东东男男22013112001103陈陈宝玉宝玉男男20013112001104张张逸凡逸凡男男2101311ClnoSpecialityInyearNumberMonitor00311计计算机算机软软件件2000120200010100312计计算机算机应应用用2000140200010301311计计算机算机软软件件20012202001103外部码(外部码(Foreign Key):若A是基本关系R1的属性(组),但不是R的码。若A与基本关系R2的主码K相对应,则称A是R1的外部码。被参照关系被参照关系参照关系参照关系关系模式关系模式
18、:一个关系的关系名及其全部属性名的集合简称为该关系的关系模式。一般表示为:关系名(属性名1,属性名2,属性名n)关系模式是型型,描述了一个关系的结构;关系则是值值,是元组的集合,是某一时刻关系模式的状态或内容。关系模型对二维表的基本限制是:表中的每一列都必须是不可分的基本数据项。在一个表中,属性间的顺序、元组间的顺序都是无关紧要的。数据操作数据操作关系数据操作是对系统动态特性的描述。关系模型操作的主要内容是选择、投影、连接、除、并、交、差等查询操作和增、删、改等维护两大内容。关系模型操作的特点:操作对象和操作结果都是关系,即关系模型中的数据操作是集合操作。关系模型中,存取路径对用户是隐蔽的。用
19、户只要指出干什么,而不必考虑怎么干。存取路径是由RDBMS自动选择的,从而方便了用户,提高了数据的独立性。关系数据语言 关系代数语言关系代数语言 关系演算语言关系演算语言 元组关系演算元组关系演算 域关系演算域关系演算 具有关系代数和关系演算双重特点具有关系代数和关系演算双重特点的语言的语言SQL完整性约束完整性约束 实体完整性:参照完整性:用户定义的完整性:若属性若属性A A是基本关系是基本关系R R的一个主属性,则任何元组在的一个主属性,则任何元组在A A上的分上的分量都不量都不能为能为空。空。这里,空是指没有值这里,空是指没有值。参照完整性是对关系间引用数据的一种限制。参照完整性是对关系
20、间引用数据的一种限制。定义:若属性组定义:若属性组A A是基本关系是基本关系R1R1的外码,它与基本关系的外码,它与基本关系R2R2主码主码K K相对应(相对应(R1R1,R2R2也可以是同一关系),则也可以是同一关系),则R1R1中每个元组在中每个元组在A A上上的值必须为:的值必须为:或者等于或者等于R2R2中某元组的主码值;中某元组的主码值;或者取空值(或者取空值(A A的每个属性值都是空值)。的每个属性值都是空值)。用户自己定义的约束条件,所以称为用户定义的完整性。用户自己定义的约束条件,所以称为用户定义的完整性。1.3 数据库系统的结构数据库系统的结构 可以从多种角度来分析数据库系统
21、的结构。数据库系统内部结构(数据库的三级模式结构数据库系统内部结构(数据库的三级模式结构数据库系统内部结构(数据库的三级模式结构数据库系统内部结构(数据库的三级模式结构 )数据库系统外部的体系结构数据库系统外部的体系结构数据库系统外部的体系结构数据库系统外部的体系结构 一、数据的三级模式结构一、数据的三级模式结构 数据模式(Data Schema):数据模式是对全体数据的逻辑结构,联系和约束的描述。某数据模式下的一组具体的数据值称为数据模式的一个实例(Instance)。因此,数据模式是稳定的,而实例是在不断变化,不断更新的。三级模式结构三级模式结构 模式模式内内模式映像模式映像外模式外模式模
22、式映像模式映像OS应用应用1应用应用2应用应用3外模式外模式A外模式外模式B模模 式式内内 模模 式式DBMS数据库数据库模式(模式(Schema):):模式也称模式也称模式也称模式也称概念模式,概念模式,概念模式,概念模式,是数据库中全体数据在逻辑是数据库中全体数据在逻辑是数据库中全体数据在逻辑是数据库中全体数据在逻辑上的视图。他通常以某种数据模型为基础,定义数据上的视图。他通常以某种数据模型为基础,定义数据上的视图。他通常以某种数据模型为基础,定义数据上的视图。他通常以某种数据模型为基础,定义数据库全部数据的逻辑结构。以及定义与数据有关的安全库全部数据的逻辑结构。以及定义与数据有关的安全库
23、全部数据的逻辑结构。以及定义与数据有关的安全库全部数据的逻辑结构。以及定义与数据有关的安全性、完整性等要求。性、完整性等要求。性、完整性等要求。性、完整性等要求。模式不是数据库本身,它仅仅描述数据库结构。模式不是数据库本身,它仅仅描述数据库结构。模式不是数据库本身,它仅仅描述数据库结构。模式不是数据库本身,它仅仅描述数据库结构。模式不涉及硬件环境和物理存储细节,也不与任何计模式不涉及硬件环境和物理存储细节,也不与任何计模式不涉及硬件环境和物理存储细节,也不与任何计模式不涉及硬件环境和物理存储细节,也不与任何计算机语言有关。算机语言有关。算机语言有关。算机语言有关。数据库管理系统提供模式描述语言
24、(模式数据库管理系统提供模式描述语言(模式数据库管理系统提供模式描述语言(模式数据库管理系统提供模式描述语言(模式DDLDDLDDLDDL)来定义模式。用模式来定义模式。用模式来定义模式。用模式来定义模式。用模式DDLDDLDDLDDL给出一个数据库逻辑定义的给出一个数据库逻辑定义的给出一个数据库逻辑定义的给出一个数据库逻辑定义的全都语句,构成了该数据库的模式。全都语句,构成了该数据库的模式。全都语句,构成了该数据库的模式。全都语句,构成了该数据库的模式。外模式(外模式(External Schema)外模式也称外模式也称外模式也称外模式也称子模式子模式子模式子模式,是个别用户的数据视图,是个
25、别用户的数据视图,是个别用户的数据视图,是个别用户的数据视图,即个别用户涉及到的数据的逻辑结构。外模式是模式即个别用户涉及到的数据的逻辑结构。外模式是模式即个别用户涉及到的数据的逻辑结构。外模式是模式即个别用户涉及到的数据的逻辑结构。外模式是模式的子集。不同用户的外模式是不同的(可相互覆盖)。的子集。不同用户的外模式是不同的(可相互覆盖)。的子集。不同用户的外模式是不同的(可相互覆盖)。的子集。不同用户的外模式是不同的(可相互覆盖)。一个应用程序只能启用一个外模式,一个外模一个应用程序只能启用一个外模式,一个外模一个应用程序只能启用一个外模式,一个外模一个应用程序只能启用一个外模式,一个外模式
26、可被同一用户的若干应用程序使用。式可被同一用户的若干应用程序使用。式可被同一用户的若干应用程序使用。式可被同一用户的若干应用程序使用。数据库管理系统提供外模式描述语言(外模式数据库管理系统提供外模式描述语言(外模式数据库管理系统提供外模式描述语言(外模式数据库管理系统提供外模式描述语言(外模式DDLDDLDDLDDL)描述外模式。用外模式描述外模式。用外模式描述外模式。用外模式描述外模式。用外模式DDLDDLDDLDDL给出的用以定义一给出的用以定义一给出的用以定义一给出的用以定义一个用户数据视图的全部语句称为此用户的外模式。个用户数据视图的全部语句称为此用户的外模式。个用户数据视图的全部语句
27、称为此用户的外模式。个用户数据视图的全部语句称为此用户的外模式。内模式(内模式(Internal Schema)内模式也称内模式也称存储模式存储模式。他既定义了数据库中全。他既定义了数据库中全部数据的物理结构,还定义了数据的存储方法、存取部数据的物理结构,还定义了数据的存储方法、存取策略等。策略等。DBMSDBMS提供内模式描述语言(内模式提供内模式描述语言(内模式DDLDDL)来来描述和定义内模式。描述和定义内模式。二级映象二级映象 在外模式与模式之间通过外模式/模式映象进行转换。当模式改变时,只要相应改变外模式/模式映象,可使外模式保持不变。在模式与内模式之间通过模式/内模式映象进行转换。
28、当数据库的存储结构改变时,只要相应改变模式/内模式映象,可使模式保持不变,从而,外模式也可保持不变。有了这二级转换,使数据库系统的数据具有较高的逻辑独立性和物理独立性。对于一个数据库系统来说,只有一个模式,一个内模式,但可以有多个外模式。实际的数据库与内模式对应,应用程序则与外模式打交道。对于一个数据库系统来说,模式/内模式映象是唯一的,但有多个外模式/模式映象,每一个外模式都有一个外模式/模式映象(包含在该外模式定义中)。二、面对用户的数据库系统体系结构 三级模式结构是数据库系统最本质的系统结构,它是从数据结构的角度来看待问题的。用户是以数据库系统的服务方式来看待数据库系统的,这就是数据库系
29、统的软件体系结构。用这种观点,当今的数据库系统大致可以分为:单用户数据库系统主从式结构的数据库系统分布式结构的数据库系统客户/服务器系统三、用户访问数据库的过程三、用户访问数据库的过程321数据数据库库应用程序应用程序A工作区工作区系统缓冲区系统缓冲区OS应用程序应用程序A外模式外模式模模 式式内模式内模式工作日志工作日志DBMS用户在应用程序中发出命令,指明外模式名。DBMS根据该命令,调出所需外模式,并检查用户的权利。若通过检查,则继续执行;否则拒绝之。DBMS根据外模式/模式转换,确认所需数据在模式上的有关信息。DBMS根据模式/内模式转换,确认所需数据在内模式上的有关信息。DBMS向操
30、作系统发出读相应数据的请求。操作系统把有关数数据从外存调入到系统缓冲区上。DBMS把数据按外模式的形式送入用户工作区。记载系统工作日志。1.4 数据库系统的组成数据库系统的组成 一、数据库系统数据库系统(DBSDBS:DataBaseDataBase System System)计算机硬件计算机硬件计算机硬件计算机硬件 操作系统操作系统操作系统操作系统 DBMSDBMS DB DB 应用程序应用程序应用程序应用程序 用户用户用户用户DBA一般用户一般用户二、二、数据库管理员数据库管理员(DataBaseDataBase Administrator)Administrator)主要职责主要职责有
31、:有:协调和沟通用户与数据库开发人员的联系。协调和沟通用户与数据库开发人员的联系。参与数据库设计工作。参与数据库设计工作。决定数据的完整性约束条件和不同用户的存取权限。决定数据的完整性约束条件和不同用户的存取权限。保证数据库的正常运行,进行数据库的维护工作。保证数据库的正常运行,进行数据库的维护工作。提出数据库的重构计划。提出数据库的重构计划。三、数据库管理系统(三、数据库管理系统(DBMSDBMS)DBMS的主要功能是:的主要功能是:数据库的定义、建立和维护功能。数据库的定义、建立和维护功能。DDLDDL数据存取功能。数据存取功能。DMLDML自主和宿主两种形式自主和宿主两种形式数据库运行管
32、理功能。包括:访问控制(检查访问数据库运行管理功能。包括:访问控制(检查访问的合法性)、并发控制(协调多用户对数据库的共同的合法性)、并发控制(协调多用户对数据库的共同操作,并保证数据的一致性)、保密控制、数据完整操作,并保证数据的一致性)、保密控制、数据完整性控制、通讯控制以及数据库内部的维护等。性控制、通讯控制以及数据库内部的维护等。DCLDCL1.5 数据库新技术一、数据库技术的发展一、数据库技术的发展第一代数据库:层次数据库和网状数据第一代数据库:层次数据库和网状数据库库 第二代数据库:关系数据库技术第二代数据库:关系数据库技术 第三代数据库:以面向对象模型为主要第三代数据库:以面向对
33、象模型为主要特征的数据库技术特征的数据库技术二、数据库新技术的主要研究领域二、数据库新技术的主要研究领域数据库管理系统软件的研制数据库管理系统软件的研制 数据库应用系统设计与开发数据库应用系统设计与开发 数据库理论数据库理论三、三、面向对象新技术面向对象新技术IBM公司的公司的DB2 Oracle公司的公司的Oracle8产品产品 四、分布式数据库四、分布式数据库分布式数据库系统主要有下面三个特点分布式数据库系统主要有下面三个特点分布式数据库系统主要有下面三个特点分布式数据库系统主要有下面三个特点数据库的数据物理上分布在各个场地,但逻辑数据库的数据物理上分布在各个场地,但逻辑数据库的数据物理上
34、分布在各个场地,但逻辑数据库的数据物理上分布在各个场地,但逻辑上是一个整体。上是一个整体。上是一个整体。上是一个整体。每个场地既可以执行局部应用(访问本地每个场地既可以执行局部应用(访问本地每个场地既可以执行局部应用(访问本地每个场地既可以执行局部应用(访问本地DBDB),),),),也可以执行全局应用(访问异地也可以执行全局应用(访问异地也可以执行全局应用(访问异地也可以执行全局应用(访问异地DBDB)。)。)。)。各地的计算机由数据通信网络相联系。本地计各地的计算机由数据通信网络相联系。本地计各地的计算机由数据通信网络相联系。本地计各地的计算机由数据通信网络相联系。本地计算机单独不能胜任的
35、处理任务,可以通过通信算机单独不能胜任的处理任务,可以通过通信算机单独不能胜任的处理任务,可以通过通信算机单独不能胜任的处理任务,可以通过通信网络取得其它网络取得其它网络取得其它网络取得其它DBDB和计算机的支持。和计算机的支持。和计算机的支持。和计算机的支持。分布式数据库系统分布式数据库系统 五、数据仓库与数据挖掘五、数据仓库与数据挖掘数据事务处理与分析处理数据事务处理与分析处理 事务处理事务处理是指对数据库联机的日常操作,是指对数据库联机的日常操作,通常对一个或一组记录的通常对一个或一组记录的查询和修改查询和修改,主,主要是为企业的特定数据管理应用。要是为企业的特定数据管理应用。分析处理分
36、析处理则用于管理人员的则用于管理人员的决策分析决策分析 要经要经常访问常访问大量的历史数据大量的历史数据,其目的是通过对,其目的是通过对这些历史数据的分析,从中提取管理决策这些历史数据的分析,从中提取管理决策所需的重要信息所需的重要信息数据仓库数据仓库是一个专门用于支持企业或部是一个专门用于支持企业或部门的管理决策分析的、面向主题的、集门的管理决策分析的、面向主题的、集成的、不可更改的、随时间不断变化的成的、不可更改的、随时间不断变化的数据集合。数据仓库的四个基本特征:数据集合。数据仓库的四个基本特征:数据仓库是面向主题的数据仓库是面向主题的数据仓库是面向主题的数据仓库是面向主题的数据仓库是集
37、成的数据仓库是集成的数据仓库是集成的数据仓库是集成的数据仓库是不可更新的数据仓库是不可更新的数据仓库是不可更新的数据仓库是不可更新的数据仓库的数据是随时间变化的数据仓库的数据是随时间变化的数据仓库的数据是随时间变化的数据仓库的数据是随时间变化的数据仓库系统的结构数据仓库系统的结构 从用户角度看,数据仓库系统是由数据源、数据仓库的从用户角度看,数据仓库系统是由数据源、数据仓库的数据存储、元数据、数据仓库的应用工具和可视化用户界面数据存储、元数据、数据仓库的应用工具和可视化用户界面组成的。组成的。数据源:数据源:指为数据仓库提供最底层数据的运作数据库系统及外指为数据仓库提供最底层数据的运作数据库系
38、统及外部数据。部数据。数据仓库:数据仓库:存贮从数据源转换的数据,供分析处理用。根据不同存贮从数据源转换的数据,供分析处理用。根据不同的分析要求,数据按不同的综合程度存储。数据仓库还用元数据的分析要求,数据按不同的综合程度存储。数据仓库还用元数据记录了数据的结构和数据仓库的任何变化。记录了数据的结构和数据仓库的任何变化。应用:应用:存放在数据仓库的数据需要借助各种应用工具来进行分析存放在数据仓库的数据需要借助各种应用工具来进行分析处理,以便真正发挥作用。目前应用工具主要有联机分析处理处理,以便真正发挥作用。目前应用工具主要有联机分析处理OLAPOLAP(On-Line Analytical P
39、rocessingOn-Line Analytical Processing)和数据挖掘(和数据挖掘(Data Data MiningMining)两大类。两大类。可视化用户界面:可视化用户界面:使得数据仓库的用户能够方便直观地与系统进使得数据仓库的用户能够方便直观地与系统进行交互,行交互,元数据元数据是关于数据、操作数据的进程和应用程序的结构和意义是关于数据、操作数据的进程和应用程序的结构和意义的描述信息,其主要的目标是提供数据资源的全面指南。范围的描述信息,其主要的目标是提供数据资源的全面指南。范围可以从设计初期的现实世界概括到详细设计的物理描述。可以从设计初期的现实世界概括到详细设计的物理描述。数据挖掘的步骤:数据挖掘的步骤:数据准备数据准备数据准备数据准备数据挖掘数据挖掘数据挖掘数据挖掘表述表述表述表述评价评价评价评价