《信息管理组织概论(5).ppt》由会员分享,可在线阅读,更多相关《信息管理组织概论(5).ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 数据管理与数据库基础,本章内容: 数据管理发展 数据库管理方法 关系数据库实现 数据仓库与数据挖掘 智能信息处理技术,5.1 数据管理概述,数据是信息在计算机世界的具体表现形式,借助于现代信息处理技术进行信息管理,也就是数据管理。,5.1.1 信息与数据,信息是事物之间相互联系、相互作用的状态的描述 。 数据是信息载体上反映信息内容且可被接收者(人或机器)识别的物理符号。 信息是数据的含义 ,数据是信息的具体表示,但使用中一般不加区别,信息管理也就是数据管理。,5.1.2 信息的组织层次,数据的组织一般分为数据项、记录、文件和数据库四个层次:,5.1.3 数据管理技术的发展,数据管理的
2、主要任务: 实现对数据的合理组织、维护和存取, 处理好应用程序与数据之间的关系。 数据管理大致经历了三个阶段:,1人工管理阶段,20世纪50年代中期以前,也就是计算机应用于业务管理之前的阶段。 数据管理的主要特点是:,2文件系统,计算机用于管理 ,有了专门管理数据的软件 。 数据管理工作的特点:,3数据库系统,处理数据量的增加,产生了专门的数据管理软件,实现对数据的管理工作。数据管理方面具有如下特点 :,5.2 数据库技术及其管理,数据库概述 概念模型 数据模型 数据库的结构 数据库系统,5.2.1 数据库概述,如前所述,数据是信息的具体化、形象化,是表示信息的物理符号。在信息系统中,要对大量
3、的数据进行处理,首先就要弄清现实世界中事物及事物间的联系是怎样的,然后再逐步分析、变换,得到系统可以处理的表现形式。 对客观世界的认识、描述是一个逐步深入的过程。 现实世界、信息世界、数据世界三个领域是由客观到认识、由认识到使用管理的三个层次;后一领域是前一领域的抽象描述。,信息描述,5.2.2 信息模型,信息模型是对信息世界的管理对象、属性及联系等信息的描述形式。 它不考虑计算机实现,客观地反映所研究问题中的信息及信息联系的模型,是对现实世界的真实反应。,l.信息模型的要素,2.两个实体集之间相互联系的方式,一对多联系 (1:n),一对一联系 (1:1),多对多联系 (m:n),3. E-R
4、方法( E-R 图),E-R方法是一种信息结构的图示法,它主要描述实体集之间的联系。通常用长方形表示实体集;用椭圆形表示实体集的属性,用菱形表示实体集间的联系。,实体联系的特点,实体和属性的区分,尽量减少实体集,能作为属性时不要作为实体集。 作为属性的事物,不能再有需要描述的性质(属性),也不能与其他事物有联系。 作为属性的事物与所描述的实体间只能1:N(含1:1)的对应关系。即表示每个职工只有一个年龄值,而每个年龄值可能对应许多职工。,5.2.3 数据模型,数据模型是面向数据库中数据的逻辑结构,是对信息世界中概念模型的数字化。一个数据模型实质上是一组向用户提供的规则。这组规则规定了数据时如何
5、组织的,其结构怎样的及相应地允许哪些操作。 1.数据模型的三要素:,(1) 构造数据库的基本数据结构类型 规定如何把基本数据项组织成更大的数据单位,并通过这种结构来表达数据项之间的关系。 数据模型是现实世界与计算机世界的中介。 数据结构类型应有很强的表达能力,可以有效地表达数据之间各种复杂的关系。,(2) 数据操作 提供的这些操作能实现对上述数据结构按任意方式组合起来所得数据库的任何部分进行检索、推导和修改等。 数据结构只规定了数据的静态结构,而数据操作的定义则说明了数据的动态特性。,(3) 完整性约束规则 它用于给出不破坏数据库完整性、数据相容性等数据关系的限定。 为了避免对数据执行某些操作
6、时破坏数据的正常关系,形成一组通用的约束规则,只允许在满足该组规则的条件下对数据库进行插入、删除、更新等操作。,2.数据模型与信息模型的关系,信息与数据具有一一对应的关系,计算机中的数据组织必须与客观世界中的信息结构相适应。 数据模型是对数据组织中各层次内部、外部之间的联系的描述。因此数据模型必须以相应的信息模型为基础。 信息模型和数据模型的对应关系如图:,3.常见数据模型概述,层次模型(Hierarchical Model) 层次模型的数据结构是一种树型结构,网状模型(Network Mode) 数据模型中各个记录型(实体集)相互联系形成一个整体均可以看着是网状模型。但为了与层次模型相区别,
7、在网状模型上增加了一些限制条件,即满足下列条件的数据模型称为网状模型:,网 状 模 型,关系模型(RelationalModel) 关系模型将数据的逻辑结构归纳为满足一定条件的二维表的形式,称为一个关系(Relation),关系又由关系框架和若干元组(Tuple)组成,一个元组实际上就是二维表中的一行内容。,关系模型的数据结构,关系操作和关系的完整性约束条件 关系操作主要包括数据查询和插入、删除、修改数据。关系中的数据操作是主要集合操作,包括传统的集合运算,如并、交、差和关系运算,如选择、连接、投影等。 关系的完整性约束条件包括三类: 关系模型的完整性约束,是为了使数据库在使用、维护、调整、更
8、新、扩展时保持数据结构的灵活、稳定、可靠和数据与程序的相对独立性。,5.2.4 数据库的结构,模式/内模式映象,应用A,应用B,应用C,应用D,应用E,外模式1,外模式2,外模式3,逻辑模式,内模式,数据库,外模式/模式映象,数据库系统的三级模式结构,数据库是存储介质上的相关数据的集合 。 数据模式由外模式、逻辑模式(模式)和内模式构成,如图所示。,1.逻辑模式及概念数据库,逻辑模式(Logical Schema)也常称为模式(Schema),它是对数据库中数据的整体逻辑结构和特征的描述。逻辑模式定义的内容 包括对数据库的记录型、数据项的型、记录问的联系等的描述, 包括对数据的安全性定义(保密
9、方式、保密级别和数据使用权)、数据应满足的完整性条件和数据寻址方式的说明。 逻辑模式为框架的数据库为概念数据库。,2.外模式及用户数据库,外模式(External Schema)也称子模式(Subschema),它是对各个用户或程序所涉及到的数据的逻辑结构和数据特征的描述。 外模式定义主要涉及对子模式的数据结构、数据域、数据构造规则及数据的安全性和完整性等属性的描述。 以子模式为框架的数据库为用户数据库,3.内模式及物理数据库,内模式(Intelnal Schema)也叫存储模式(Access Scherna)或物理模式(Physical Schema)。内模式是对数据的内部表示或底层描述。
10、内模式不仅定义数据的数据项、记录、数据集、索引和存取路径在内的一切物理组织方式等属性,同时还要规定数据的优化性能、响应时间和存储空间需求,规定数据的记录位置、块的大小与数据溢出区等。 以物理模式为框架的数据库为物理数据库。,5.2.5 数据库系统的构成,数据库系统是指带有数据库并利用数据库技术进行数据管理的计算机系统。一个数据库系统包括:,1数据库系统的构成,数据库系统的系统结构:,2. 数据库管理系统的功能结构,5.3 关系型数据系统及其应用,1 关系数据库的特点 2 关系数据语言简介 3 结构化查询语言(SQL) 4 常见关系数据库系统简介,5.3.1 关系数据库的特性,5.3.2 关系数
11、据语言简介,1关系数据语言分类,2关系数据语言的特点,1. SQL的特点,5.3.3 结构化查询语言(SQL),SQL的命令,2SQL语言应用,(1)定义数据库中二维表的结构 如:学生基本信息包含学生的学号、姓名、年龄、入学日期,数据表定义如下: CREATE TABLE 学生基本信息表 ( 学号 varchar(10), 姓名 varchar(20), 年龄 int, 入学日期 datetime ),(2) 向数据表中增加、删除、修改信息 INSERT INTO学生基本信息表(学号,姓名,年龄,入学日期) VALUSE(20070401,王强,18,2007/09/10) UPDATE 学生
12、基本信息表 SET 年龄=19 WHERE 学号=20070401 DELETE FROM 学生基本信息表 WHERE 学号=20070401,(3)从表中检索数据 例如:从学生基本信息表中找年龄为19岁的学生的信息: SELECT * FROM学生基本信息表 WHERE 年龄=19,5.3.4 常见关系数据库系统简介,1Fox pro Fox pro是FoxBase进行改进后的产品。主要特点: (1)提供并引入了强有力的辅助工具,例如屏幕生成工具;报表生成工具;标签生成工具;菜单生成器;以及项目管理工具。 (2)可以使用SQL标准查询语言。 (3)通过查询优化技术、按例相关查询技术以及新的索
13、引结构等进行更快速方便的数据查询。 (4)提供了与高级语言C语言的接口工具。 (5)提供了编译分销工具,使所开发的应用系统可以完全脱离Foxpro环境运行。 主要适用于小型应用系统的开发,或中型数据库应用系统的前端开发工具。,2ORACLE (1)具有很强的可移植性、可兼容性和可联接性。可在100多种不同类型的计算机系统上运行,支持多种操作系统。允许不同类型的计算机和操作系统通过网络共享其信息资源。 (2)Oracle8以新版本已超出了客户/服务器范围,发展到了分布式数据管理。通过网络联接,Oracle将存放在多台计算机上的数据组合成一个逻辑数据库,可被全部网络用户存取,像集中式系统一样具有用
14、户透明性和数据的一致性。 (3)支持多用户、大型数据库的高性能事务处理。支持大小可到几百GB的数据库,支持大量用户同时在同一数据上执行各种应用。 (4)Oracle系统有较好的安全性和完整性控制。遵守数据存取语言、操作系统、用户接口和网络通信协议的工业标准,可以很好地保护用户投资。,3Sybase Sybase公司是后起之秀,其DBMS始终保持“领先一步”: (1)CS结构。 (2)存储过程、触发器和Transact-SQL语言。 (3)远程调用(RPC)功能。提供了一个数据库外壳,可以通过它来访问远程表。 (4)多服务器结构,以最大效率处理各种任务和输入输出工作。 (5)编程式应用程序接口(
15、API)。可以将数据库处理与电子邮件和客户书写的应用联接起来,具有很好的开放性。 (6)Sybase系统在有关工具及实用程序方面有一些欠缺,需借助第三方的软件予以辅助。 (7)能够在异构DBMS之间方便地进行复制。 (8)采用基于脚本的方式支持Internet。用户可在Web主页被激活时访问特定的数据库。,4Informix 主要特点有: (1)它是UNIX系统上效率高、性能好的DBMS。 (2)Informix除本身DBMS有较好的工具之外,还有一种以SQL为基础的第四代语言Informix-4GL,支持以格式为基础的交互式应用开发。此外,Informix还有一种数据库访问工具Informi
16、x-Wing2,它是一种具有扩展的数据访问和“前端处理”能力的多用途的电子数据表,它与数据库的紧密结合受到广泛称赞。 (3)Informix不能在异构DBMS之间复制数据,这一点会影响Informix系统应用的广泛性。,5Microsoft SQLServer 只在Windows NT上运行。主要特点: (1) WindowsNT与SQLServer有“更亲的血缘关系”。 (2) SQL Server不能提供异构DMBS配置下在两个DMBS之间复制,但它可以通过ODBC到其他的DBMS中取得数据。很多数据库或前端产品均支持ODBC。 (3)SQLServer所支持的语言是Transact-SQ
17、L,诸如存储过程这样的扩展已使Transact-SQL的编程功能大大提高。 (4)SQL Server对Internet的支持是通过Windows NT中的IIS进行的。在支持Internet方面,还有一个与Microsoft SQL server一起交付的SQL Server Assistant,它是帮助开发面向Web应用的工具。,5.4 数据仓库与数据挖掘,1 数据仓库的产生 2 数据仓库的概念和特点 3 数据仓库的体系结构 4 数据仓库的发展前景 5 数据挖掘简介,5.4.1 数据仓库的产生,随着计算机技术的飞速发展和企业界不断提出新的需求,数据仓库技术应运而生,主要有以下两方面的需求促
18、成了数据仓库的建立和使用。,1全局应用的需求,当企业需要企业范围内的全局应用时,直接在繁杂的多个子系统上实施是很困难或不可能的。而数据仓库中存储的是经过集成的信息,具有公司范围内的全局模式。通过集成,来自各数据源的相关数据被转换成统一格式,以便进行全局应用。,2复杂分析的需求,企业中除了对业务数据进行事务处理操作和简单的统计汇总以外,高层管理者还要使用数据(历史的、现在的)进行各种复杂分析以支持决策。 从大量的历史数据中获取信息,要求系统保存大量的历史数据,而且还要进行复杂的分析处理。这些功能对用于频繁操作性处理的数据库系统而言,将成为沉重的负担。,5.4.2 数据仓库的概念和特点,概念:数据
19、仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。,特点 :,5.4.3 数据仓库的体系结构,5.4.4 数据仓库的发展前景,数据仓库概念在多个领域得到应用 。 数据仓库绝不是对数据库的替代。数据仓库和操作性数据库在企业的信息环境中承担着不同的任务(高层决策分析和日常操作性处理),并发挥着不同的作用。 用于高层决策的数据仓库需要丰富的数据基础,存储的数据量庞大,同时要使数据仓库真正发挥作用,还要有高层分析工具。,5.4.5 数据挖掘(DataMining)简介,数据挖掘,也可以称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称KD
20、D),是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。 数据挖掘的重要性就来源于数据仓库中巨大的数据量。 数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行统计、分析、综合和推理,以指导实际问题的求解,发现事物间的相互关联,甚至利用已有的数据对未来的活动进行预测。,5.5 智能信息处理技术,智能信息处理就是将不完全、不可靠、不精确、不一致和不确定的知识和信息逐步变为完全、可靠、精确、一致和确定的知识和信息的过程和方法,就是利用对不精确性、不确定性的容忍来达到问题的可处理性。,智能信息处理涉及到信息科学的多个领域,包括:,1. 智能和人工智能,2. 计算智能,计算智能就是以人工神经网络为主导,与模糊逻辑系统、进化计算以及信号与信息处理学科的综合集成处理能力。,3.智能信息处理技术,新一代的计算智能信息处理技术应是神经网络、模糊系统等交叉学科的综合集成技术。,计算智能信息处理技术,