《数据库与数据仓库35987.pptx》由会员分享,可在线阅读,更多相关《数据库与数据仓库35987.pptx(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 数据库与数据仓库数据库与数据仓库 信信息息管管理理系系统统开开发发结结构构第四章第四章 数据库和数据仓库数据库和数据仓库n n 第一节 数据管理n n 第二节 数据库与数据库管理系统环境n n 第三节 关系数据库模型n n 第四节 数据库的建立n n 第五节 数据仓库与数据挖掘n n 第六节 高级数据库技术和高级数据库应用 第一节第一节 数据管理数据管理n n什么是数据管理什么是数据管理n n数据组织的层次数据组织的层次n n实体、属性和关键字实体、属性和关键字n n数据管理的传统方法数据管理的传统方法n n数据管理的数据库方法数据管理的数据库方法为什么要进行数据管理为什么要进行
2、数据管理 名名称称,时时代代,作作者者,规规格格,幅幅面面,内内容容,卷卷前前引引首首,前前隔隔水水,后后隔隔水水,题跋,历代收藏人,印章,真迹图,细部放大图题跋,历代收藏人,印章,真迹图,细部放大图为什么要进行数据管理为什么要进行数据管理n n第一,“信息孤岛”问题日益严重,数据采集、整理、分析的繁重任务,多源异构的海量数据存储,信息资源有效利用的需求,旧有的数据管理与企业发展的冲突等等;n n第二就是系统的自动化程度不高,各个系统不能平滑地集成起来;n n第三就是信息系统的成本,我们曾谈到,信息系统集成成本比信息系统建设的成本高甚至几倍。什么是数据管理什么是数据管理n n根据赛迪顾问的界定
3、,中国数据管理技术应用软件主要包括:企业信根据赛迪顾问的界定,中国数据管理技术应用软件主要包括:企业信息门户(息门户(EIPEIP)、商业智能()、商业智能(BIBI)、内容管理()、内容管理(CMCM)、知识管理系统)、知识管理系统(KMSKMS)和竞争情报系统()和竞争情报系统(CISCIS)五大应用软件领域。)五大应用软件领域。数据管理的定义数据管理的定义数据组织的层次n n数据按照层次方式进行组织n n由位、字节、字段、记录、文件和数据库组成由位、字节、字段、记录、文件和数据库组成n n位(位(BitBit)n n位位是是计计算算机机中中最最小小的的数数据据单单位位,其其值值为为0 0
4、或或1 1,是是一一个二进位,表示一个导通或未通的电路。个二进位,表示一个导通或未通的电路。n n字节(字节(ByteByte)n n字字节节是是由由若若干干位位组组成成的的,代代表表一一个个字字符符。字字符符是是信信息的最基本构架。(见息的最基本构架。(见ASCIIASCII码表)码表)ASCII编码表编码表数据组织的层次n n字段(字段(FieldField)。)。n n多个字符组成一个词或者一个完整的数字(如人名多个字符组成一个词或者一个完整的数字(如人名或年龄),或年龄),n n字段是数据的最小单位,它不能再分成有意义的单字段是数据的最小单位,它不能再分成有意义的单位位n n记录(记录
5、(RecordRecord)n n由与某个特殊对象或活动有关的所有字段组成。由与某个特殊对象或活动有关的所有字段组成。n n文件(文件(FileFile)n n同一类型的所有记录组成一个文件同一类型的所有记录组成一个文件n n文件就是与某个特定主题相关的数据记录的集合。文件就是与某个特定主题相关的数据记录的集合。(字母J的ASCII码)数据的层次数据的层次举例举例文件文件字节字节字段字段纪录纪录0100101001001010900811900811刘汉云刘汉云 2000-9-4 2000-9-4位位00,11数据库数据库刘汉云刘汉云项目数据库包含:职员编号、姓名、聘用日期学分及成绩的记录职员
6、文件(名字字段)职员文件部门文件财务文件900811刘汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 2001-8-2模型的概念:模型的概念:模型的概念:模型的概念:对现实世界事物特征的模拟和抽象就是这个事物的模型。对现实世界事物特征的模拟和抽象就是这个事物的模型。计算机不能直接处理现实世界中的具体事物,所以必须计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换为抽象的模型,然后再将其转换为计算机先把具体事物转换为抽象的模型,然后再将其转换为计算机可以处理的数据,从而以模拟的方式实现对现实世界事物的可以处理的数据,从而以模拟的方式实现对现实世界事物的
7、处理。处理。模型应满足以下要求:模型应满足以下要求:n n真实地反映现实世界;真实地反映现实世界;n n易被人理解;易被人理解;n n便于在计算机上实现;便于在计算机上实现;基本术语基本术语n n实体:客观存在、并且可以互相区别的事物称为实体。实体:客观存在、并且可以互相区别的事物称为实体。n n属性:实体所具有的每一个特性都称为一个属性。选属性:实体所具有的每一个特性都称为一个属性。选择的实体属性越多,所描述的实体就越清晰。属性有择的实体属性越多,所描述的实体就越清晰。属性有“型型”和和“值值”的概念,属性的名称就是属性的的概念,属性的名称就是属性的“型型”;对型;对型的具体赋值就是属性的的
8、具体赋值就是属性的“值值”。n n主键值(码)主键值(码):在众多属性中能够唯一标识实体的属:在众多属性中能够唯一标识实体的属性或属性组。性或属性组。n n实体集:某个实体型下的全部实体,称为实体集。实体集:某个实体型下的全部实体,称为实体集。n n联系:一个实体集内部各实体之间的相互联系,叫做联系:一个实体集内部各实体之间的相互联系,叫做实体内部联系。在实体集之间的联系,称为实体的外实体内部联系。在实体集之间的联系,称为实体的外部联系。部联系。实体、属性和关键字实体、属性和关键字n n实体entityn n实体是所收集的数据相关的一类事物,可以是实体是所收集的数据相关的一类事物,可以是物,人
9、,实际的东西,或者具体的东西物,人,实际的东西,或者具体的东西n n员工员工n n库存库存n n客户客户n n订单订单n n教室教室实体、属性和关键字实体、属性和关键字n n属性Attributen n属性是实体的某一方面的特征属性是实体的某一方面的特征n n学生的姓名、学号、年龄、性别成绩是学生的学生的姓名、学号、年龄、性别成绩是学生的属性属性n n库存号、说明、现有数量、在仓库中的位置等库存号、说明、现有数量、在仓库中的位置等是库存的属性是库存的属性实体、属性和关键字实体、属性和关键字n n关键字 Primary Keyn n关键字是用来识别记录的一个或一组数据项,关键字是用来识别记录的一
10、个或一组数据项,是识别记录和文件中查找记录的标志是识别记录和文件中查找记录的标志n n学生文件中的学号,产品文件中的产品号,订学生文件中的学号,产品文件中的产品号,订单文件中的订单号单文件中的订单号n n辅助关键字 Secondary Keyn n不能唯一表示一个记录的字段不能唯一表示一个记录的字段数据管理的传统方法数据管理的传统方法n n利用文件管理数据利用文件管理数据n n为每个应用程序分别创建和存储数据文件的数据为每个应用程序分别创建和存储数据文件的数据管理方法都称为传统方法管理方法都称为传统方法应用程序应用程序 A A文件A应用程序应用程序 B B文件B应用程序应用程序 C C文件C数
11、据管理传统方法的不足数据管理传统方法的不足n n数据冗余大n n冗余是指在多个数据文件中重复出现相同的数冗余是指在多个数据文件中重复出现相同的数据。据。n n数据与程序独立性不高n n数据文件和维护它的相关程序之间过分依赖。数据文件和维护它的相关程序之间过分依赖。数据管理的数据库方法数据管理的数据库方法n n数据库是逻辑相关的记录和文件的集合。n n把把先先前前提提及及的的所所有有存存储储在在独独立立文文件件中中的的记记录录归归并并在在一一个个数数据据库库内内,以以便便让让不不同同的的应应用用程程序序存存取。取。n n储储存存在在数数据据库库中中的的数数据据既既独独立立于于使使用用它它的的计计
12、算算机程序,也独立于存储它的外部存储器的类型。机程序,也独立于存储它的外部存储器的类型。数据库管理系统中的模式数据库管理系统中的模式数据库管理系统中的模式数据库管理系统中的模式n n物物理理模模式式:描描述述数数据据的的物物理理存存储储形形式式,也也称称内内模模式式,直接与操作系统或硬件相联系。直接与操作系统或硬件相联系。n n概概念念模模式式(逻逻辑辑模模式式):数数据据库库数数据据的的完完整整表表示示,是是所所有有用用户户的的公公共共数数据据视视图图。模模式式仅仅仅仅涉涉及及数数据据类类型型的的描述,不涉及具体的数据值。描述,不涉及具体的数据值。n n子子模模式式:针针对对每每一一个个用用
13、户户或或应应用用,又又由由模模式式导导出出若若干干个个子子模模式式(或或叫叫外外模模式式、用用户户模模式式)。子子模模式式是是直直接接面面向向用用户户的的,用用户户能能够够看看见见并并使使用用的的是是逻逻辑辑结结构构的的局局部部数数据据描描述述。每每一一个个子子模模式式都都是是模模式式的的一一个个子子集集;也也可可以以看看作作是是模模式式的的一一个个窗窗口口。一一个个数数据据库库系系统统可可以以有有多个子模式。多个子模式。两级映射可保证三种模式之间的相互独立性。两级映射可保证三种模式之间的相互独立性。数据库管理系统n nDatabase Management SystemDatabase Ma
14、nagement System,DBMSDBMSn n在数据库管理系统中,应用程序不能直接从存储介质获得在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据。它必须先将请求提交给所需的数据。它必须先将请求提交给DBMSDBMS,由,由DBMSDBMS负负责从存储介质检索数据并提供给应用程序使用责从存储介质检索数据并提供给应用程序使用基于数据库方法的优点基于数据库方法的优点n n减减少少数数据据冗冗余余,更更有有效效利利用用存存储储空空间间并并增增强强数数据据的的完完整整性性。也也为为组组织织提提供供了了更更大大地地利利用用数数据据的灵活性。的灵活性。n n两两个个文文件件中中的的数数据
15、据放放在在了了同同一一个个数数据据库库,可可以以多种方法定位数据并获得要处理的数据多种方法定位数据并获得要处理的数据n n共享数据和信息资源共享数据和信息资源第二节第二节 数据库与数据库管理数据库与数据库管理系统环境系统环境n n数据库及其特征n n数据库管理系统n n数据库查询语言n n数据的逻辑视图和物理视图数据库及其特征数据库及其特征n n数据库的定义n n数数据据库库(DatabaseDatabase)是是一一个个信信息息的的集集合合,在在这这个个集集合合中中可可以以按按照照信信息息的的逻逻辑辑结结构构对对其其进进行行组组织与存取。织与存取。n n数据库由两部分组成n n信息本身信息本
16、身n n信息的逻辑结构信息的逻辑结构数据库特征数据库特征n n信息的集合数据库特征数据库特征n n逻辑结构n n数据字典包含信息的逻辑结构数据字典包含信息的逻辑结构数据库的特征数据库的特征n n信息中的逻辑联系n n建立信息间的联系或关系意味着找出文件之间建立信息间的联系或关系意味着找出文件之间的相互关系的相互关系.n n主关键字主关键字n n数据库文件中的一个字段数据库文件中的一个字段,唯一描述一个记录唯一描述一个记录n n产品文件中的产品产品文件中的产品ID,ID,供应商文件中的供应商编号供应商文件中的供应商编号n n外部关键字外部关键字n n一个文件中的主关键字出现在另一个文件中就是外一
17、个文件中的主关键字出现在另一个文件中就是外部关键字部关键字,比如产品文件中的供应商文件比如产品文件中的供应商文件.数据库的特征数据库的特征n n内在的完整性约束n n完整性约束是保证信息质量的一种规则完整性约束是保证信息质量的一种规则n n比如比如n n产品产品IDID不能重复不能重复n n产品文件中的产品文件中的供应商供应商IDID不应该是供应商文件中没有不应该是供应商文件中没有的的供应商供应商IDID数据库管理系统数据库管理系统n nDatabase Management Systemn n是一组软件是一组软件,允许组织集中并有效地管理数据以允许组织集中并有效地管理数据以供应用程序访问供应
18、用程序访问n n相当与应用程序和物理数据文件之间的接口相当与应用程序和物理数据文件之间的接口数据库管理系统的组成数据库管理系统的组成n n数据定义语言数据定义语言n n数据操作语言数据操作语言n n数据字典数据字典数据库管理系统组成数据库管理系统组成n n数据定义语言数据定义语言n n描述数据库内容和结构的正式语言描述数据库内容和结构的正式语言描述数据库内容和结构的正式语言描述数据库内容和结构的正式语言n n数据操作语言数据操作语言n n操作数据库中的数据操作数据库中的数据操作数据库中的数据操作数据库中的数据,提供了一组提取数据的命提供了一组提取数据的命提供了一组提取数据的命提供了一组提取数据
19、的命令令令令n n数据字典数据字典n n自动生成或者手工生成的文件,用来存储数据自动生成或者手工生成的文件,用来存储数据自动生成或者手工生成的文件,用来存储数据自动生成或者手工生成的文件,用来存储数据元素的定义和特性。如用途元素的定义和特性。如用途元素的定义和特性。如用途元素的定义和特性。如用途,物理表现物理表现物理表现物理表现,所属关系所属关系所属关系所属关系,授权和安全授权和安全授权和安全授权和安全.被动的被动的被动的被动的,主动的主动的主动的主动的.数据字典数据字典数据字典数据字典n n给数据流程图中每个成分以定义和说明的工具。在数据流给数据流程图中每个成分以定义和说明的工具。在数据流程
20、图中仅对系统逻辑功能的总体框架作了描述,缺乏详细程图中仅对系统逻辑功能的总体框架作了描述,缺乏详细具体的说明。数据字典的作用是对数据流程图中的各种成具体的说明。数据字典的作用是对数据流程图中的各种成分,包括数据项、数据结构、数据流、数据存储、处理功分,包括数据项、数据结构、数据流、数据存储、处理功能、外部项等的逻辑内容与特征予以详细说明。数据字典能、外部项等的逻辑内容与特征予以详细说明。数据字典中有关系统的详细信息是以后系统设计、系统实施与维护中有关系统的详细信息是以后系统设计、系统实施与维护的重要依据。的重要依据。n n数据字典编写的基本要求如下:数据字典编写的基本要求如下:n n对数据流程
21、图中各种成分的定义必须明确、易理解、唯一;对数据流程图中各种成分的定义必须明确、易理解、唯一;n n命名、编号与数据流程图一致;命名、编号与数据流程图一致;n n符合一致性与完整性的要求,对数据流程图上的成分定义与说明符合一致性与完整性的要求,对数据流程图上的成分定义与说明无遗漏项,无同名异义或异名同义;无遗漏项,无同名异义或异名同义;n n格式规范、文字精炼与符号正确。格式规范、文字精炼与符号正确。财务管理第三层工资管理数据流程图财务管理第三层工资管理数据流程图数据字典中的条目数据字典中的条目 n n数据项:是数据处理中不可分割的基本逻辑单位。包括数据项编号、数据项:是数据处理中不可分割的基
22、本逻辑单位。包括数据项编号、名称、取值范围、数据项类型、长度等。名称、取值范围、数据项类型、长度等。n n数据结构:描述数据流数据结构:描述数据流/数据存储的逻辑组成。数据结构条目内容包数据存储的逻辑组成。数据结构条目内容包括:数据结构名称、编号、包含该结构的数据流括:数据结构名称、编号、包含该结构的数据流/数据存储的编号、数据存储的编号、该数据结构中包含的数据项名称等。该数据结构中包含的数据项名称等。数据字典中的条目数据字典中的条目 n n数据流:定义数据流程图中的数据流,内容为数据流的编号、名称来数据流:定义数据流程图中的数据流,内容为数据流的编号、名称来源、去向、包含数据结构的名称以及单
23、位时间(如年月日)传输次数源、去向、包含数据结构的名称以及单位时间(如年月日)传输次数等。等。n n数据存储:存储条目的内容有数据存储的名称、编号、组成(即数据数据存储:存储条目的内容有数据存储的名称、编号、组成(即数据存储包含的数据结构)、最大记录数等。存储包含的数据结构)、最大记录数等。n n处理功能:条目内容有处理功能的名称、编号、输入数据流、输出数处理功能:条目内容有处理功能的名称、编号、输入数据流、输出数据流、处理逻辑概括等。据流、处理逻辑概括等。n n外部实体:条目内容有外部实体名称、编号、输入数据流、输出数据外部实体:条目内容有外部实体名称、编号、输入数据流、输出数据流等。流等。
24、数据库查询语言数据库查询语言n n属于数据操作语言属于数据操作语言n n自然语言n n自然语言查询命令自然语言查询命令n nLIST THE NAMES AND ADDRESSES OF ALL LIST THE NAMES AND ADDRESSES OF ALL SUPPLIERS WHO LIVE IN SHANGHAISUPPLIERS WHO LIVE IN SHANGHAIn nQBEn nQuery By ExampleQuery By Examplen n通过拖曳数据项等方法来查询数据通过拖曳数据项等方法来查询数据数据库查询语言数据库查询语言n nSQLn nStructure
25、d Query Languagen n结构化查询语言标准结构化查询语言标准n n利用利用SQLSQL可以查询不同数据库管理系统下的数可以查询不同数据库管理系统下的数据据.n n基本形式基本形式n nSELECTFROMWHERESELECTFROMWHERE数据视图和逻辑视图数据视图和逻辑视图n nDBMS把数据的逻辑视图和物理视图分开把数据的逻辑视图和物理视图分开n n逻逻辑辑视视图图以以最最终终用用户户所所使使用用的的直直观观的的方方式式来来显显示数据示数据n n物物理理视视图图则则显显示示了了数数据据的的实实际际组组织织形形式式以以及及它它在物理存储介质上的结构在物理存储介质上的结构n
26、n一个物理视图可支持多个逻辑视图一个物理视图可支持多个逻辑视图n nDBMSDBMS使使用用专专门门的的数数据据库库管管理理软软件件,使使得得物物理理数数据据库库可可用用于于不不同同应应用用程程序序所所需需的的不不同同的的逻逻辑辑视图。视图。第三节第三节 关系数据库模型关系数据库模型n n四种数据库模型n n层次型层次型n n网状型网状型n n关系型关系型n n目前使用最为广泛目前使用最为广泛n n面向对象面向对象层次型数据库层次型数据库n n层次模型:实体之间按层次关系来定义。实体用记录表示,实体层次模型:实体之间按层次关系来定义。实体用记录表示,实体的属性对应记录的数据项。层次模型以每个实
27、体为结点,上层结的属性对应记录的数据项。层次模型以每个实体为结点,上层结点叫点叫“父结点父结点”,下层结点叫,下层结点叫“子结点子结点”。如下图所示。如下图所示n n仅有一个无双亲的根结点;根结点叶子结点仅有一个无双亲的根结点;根结点叶子结点n n根结点以外的子结点,向上仅有一个父结点,向下有若干子结点。根结点以外的子结点,向上仅有一个父结点,向下有若干子结点。网状模型数据库网状模型数据库n n网状模型:可表达比较复杂的实体间关系(多对多),但当需要网状模型:可表达比较复杂的实体间关系(多对多),但当需要对系统扩展时,对原有数据结构及应用程序的修改,需要花费更对系统扩展时,对原有数据结构及应用
28、程序的修改,需要花费更多的代价,甚至带来严重的后果。主要特征如下:多的代价,甚至带来严重的后果。主要特征如下:n n有一个以上的结点无双亲;有一个以上的结点无双亲;n n至少有一个结点有多个双亲;至少有一个结点有多个双亲;关系数据库模型关系数据库模型n n利用一系列的二维表或文件存储信息.n n在关系模型中,每个二维表都描述一种关系.n n关系是表的数学术语关系是表的数学术语n n每一个表或关系所保存的信息都与一个特定的实体有关.n n二维表使描述信息间的关系十分便利,容易处理二维表所包含的信息.n n可以灵活地查询数据库和建立报表关系数据库模型关系数据库模型n n可以灵活地查询数据库和建立报
29、表n n查询单个表和多个表查询单个表和多个表n n不必建立数据项之间的所有连接不必建立数据项之间的所有连接,随时可以建立随时可以建立.关系数据库模型关系数据库模型n n关系模型:以表格形式作为基本的存储结构,通过相关系模型:以表格形式作为基本的存储结构,通过相同关键字段来实现表格间的数据联系。结构简单、易同关键字段来实现表格间的数据联系。结构简单、易学易用是其主要特点,很受用户欢迎,是目前的主流。学易用是其主要特点,很受用户欢迎,是目前的主流。n n由于系统中实体包括许多属性,而这些属性又会被不由于系统中实体包括许多属性,而这些属性又会被不同用户的用户使用,所以将这些属性一起放在一个数同用户的
30、用户使用,所以将这些属性一起放在一个数据表中显然是不合理的,需要进行分类与汇总,以编据表中显然是不合理的,需要进行分类与汇总,以编制不同的、且相关联的表,这就是所谓的关系。制不同的、且相关联的表,这就是所谓的关系。n n表具有以下四个性质:表具有以下四个性质:n n在表中的任意一列上,数据项应属于同一个属性;在表中的任意一列上,数据项应属于同一个属性;n n表中所有行都是不相同的,不允许有重复行出现;表中所有行都是不相同的,不允许有重复行出现;n n行的顺序无关;行的顺序无关;n n列的顺序无关,但不能重复;列的顺序无关,但不能重复;第四节第四节 关系数据库的建立关系数据库的建立n n确定实体
31、和关键字n n确定实体之间联系n n利用E_R图得到关系n n为每个关系确定信息(字段)n n用数据定义语言创建数据库学生修课管理学生修课管理n n学生选修样本报表确定实体和关键字确定实体和关键字n n三个实体n n学生学生n n专业专业n n课程课程n n关键字n n学号学号n n专业号专业号n n课程号课程号确定实体之间的联系确定实体之间的联系-画实体联系图画实体联系图n n实体联系图(Entity-Relationship Diagram,E-R图)n n矩形表示实体n n菱形表示实体之间的联系n n直线表示连接n n1 1代表出现一次代表出现一次,M,M代表多次代表多次确定实体之间的联
32、系确定实体之间的联系-画实体联系图画实体联系图确定实体之间的联系确定实体之间的联系-画实体联系图画实体联系图n n先画上矩形n n填上实体名n n判断是否有联系n n有联系画上菱形,判断联系是1还是M利用利用E-R图得到关系图得到关系n n将每一个实体都转化为一个关系n n学生、课程、专业学生、课程、专业n n将每一个多对多的联系都转换为一个关系联系的名称为关系的名称n n选修选修n n将每一个一对多的联系都转换为一个关系 分配分配n n合并具有相同关键字的关系:学生与分配合学生与分配合并并为每个关系确定信息(字段)为每个关系确定信息(字段)n n确保每个关系中所含的信息确实处于正确的关系之中
33、n n这组信息只依赖于所属关系的主关键字这组信息只依赖于所属关系的主关键字n n专业名称专业名称n n信息不能从其他的信息中派生出来用数据定义语言创建数据库用数据定义语言创建数据库n n根据前面四步的结果来,运用数据定义语言来创建关系数据库三范式数据库三范式n n在建立数据库表时,如何使数据结构合理有效,在建立数据库表时,如何使数据结构合理有效,需要遵守一定的法则,即五大需要遵守一定的法则,即五大“范式范式”,其中常用,其中常用的为前三个的为前三个“范式范式”n n第一范式:在同一表中没有重复项出现,即不能将同第一范式:在同一表中没有重复项出现,即不能将同一属性定义两次;一属性定义两次;n n
34、第二范式:每个表必须有(仅有)一个数据元素作为第二范式:每个表必须有(仅有)一个数据元素作为主关键字,其他数据元素与主关键字一一对应。这个主关键字,其他数据元素与主关键字一一对应。这个主关键字作为与其他相关表之间建立关联的唯一纽带。主关键字作为与其他相关表之间建立关联的唯一纽带。n n第三范式:表中的所有数据元素不但要能够唯一地被第三范式:表中的所有数据元素不但要能够唯一地被关键字所标识,而且它们之间还必须相互独立,不存关键字所标识,而且它们之间还必须相互独立,不存在其他的函数关系或直接计算关系,即无直接依赖性。在其他的函数关系或直接计算关系,即无直接依赖性。如果需要出现相关数据,则应将该数据
35、放入到其他的如果需要出现相关数据,则应将该数据放入到其他的表中,再保留与原数据库表的关键字关联。表中,再保留与原数据库表的关键字关联。第五节第五节 数据仓库与数据挖掘数据仓库与数据挖掘n n数据往往放在不同的数据库系统中n n数据难以收集n n数据仓库是通过集成企业的关键运行数据,产生一致的、可靠的、易于访问的数据形式。数据仓库数据仓库n n数据仓库(数据仓库(Data Warehouse)是信息的逻)是信息的逻辑集合,这些信息来自于许多不同的业务辑集合,这些信息来自于许多不同的业务数据库,并用于支持企业的分析活动和决数据库,并用于支持企业的分析活动和决策任务策任务数据仓库数据仓库n n数据仓
36、库的特征数据仓库的特征n n数据仓库将来自于不同数据库的信息结合在一数据仓库将来自于不同数据库的信息结合在一数据仓库将来自于不同数据库的信息结合在一数据仓库将来自于不同数据库的信息结合在一起起起起n n数据仓库是多维的数据仓库是多维的数据仓库是多维的数据仓库是多维的n n包含若干层的行列包含若干层的行列包含若干层的行列包含若干层的行列n n数据字典:信息的逻辑结构、信息的来源和处理方数据字典:信息的逻辑结构、信息的来源和处理方数据字典:信息的逻辑结构、信息的来源和处理方数据字典:信息的逻辑结构、信息的来源和处理方式式式式n n数据仓库支持决策而不是事务处理数据仓库支持决策而不是事务处理数据仓库
37、支持决策而不是事务处理数据仓库支持决策而不是事务处理n n联机分析处理(联机分析处理(联机分析处理(联机分析处理(OLAP)OLAP)n n联机事物处理联机事物处理联机事物处理联机事物处理(OLTP)(OLTP)数据挖掘工具数据挖掘工具n nData Mining Tools是用户对数据仓库进行信息生成的软件工具n n支持OLAPn n支持决策任务数据挖掘工具数据挖掘工具n n包括:n n查询与报表工具查询与报表工具n nQBE,SQL,QBE,SQL,报表生成器报表生成器n n智能代理智能代理n n应用各种像神经网络、模糊逻辑这样的人工智能工应用各种像神经网络、模糊逻辑这样的人工智能工具形成具形成OLAPOLAP信息发现的基础信息发现的基础n n多维分析工具多维分析工具n n是一种横纵分割的技术,允许人们从不同的角度来是一种横纵分割的技术,允许人们从不同的角度来观看多维信息观看多维信息第六节第六节第六节第六节 高级数据库技术和高级数据库应用高级数据库技术和高级数据库应用高级数据库技术和高级数据库应用高级数据库技术和高级数据库应用