《第1章 数据库系统概论.ppt》由会员分享,可在线阅读,更多相关《第1章 数据库系统概论.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据库系统原理及应用数据库系统原理及应用第第3版版 第第1章章 数据库系统概论数据库系统概论本课程解决的问题:本课程解决的问题:如何有效的组织、管理计算机系统中的大量的数据?如何有效的组织、管理计算机系统中的大量的数据?主要内容主要内容 :数据管理技术发展的三个阶段数据管理技术发展的三个阶段 数据描述及数据模型数据描述及数据模型 数据库系统体系结构数据库系统体系结构 数据库系统结构数据库系统结构 重点:重点:数据模型数据模型 数据库系统结构数据库系统结构 1.1 数据管理技术数据管理技术1.1.1 数据管理技术发展经历的三个阶段:数据管理技术发展经历的三个阶段:人工管理阶段人工管理阶段(20世
2、纪世纪50年代中期以前)年代中期以前)文件系统管理阶段文件系统管理阶段(20世纪世纪50年代后期至年代后期至 60年代中期)年代中期)数据库管理阶段数据库管理阶段(20世纪世纪60年代末开始)年代末开始)一一.人工管理阶段人工管理阶段存储介质:存储介质:磁带、卡片、纸带(无磁盘)。磁带、卡片、纸带(无磁盘)。应用:主要用于科学计算。应用:主要用于科学计算。特点:数据量小、计算复杂。特点:数据量小、计算复杂。数据管理的特点:数据管理的特点:(1)数据不保存在计算机中。)数据不保存在计算机中。(2)只有程序的概念,无文件的概念。)只有程序的概念,无文件的概念。(3)没有专用的软件对数据进行管理。)
3、没有专用的软件对数据进行管理。(4)数据面向应用,程序与数据不具有独立性。)数据面向应用,程序与数据不具有独立性。二二 文件系统管理阶段文件系统管理阶段存储介质:出现了磁盘和磁鼓。存储介质:出现了磁盘和磁鼓。应用:由科学计算转向于信息管理。应用:由科学计算转向于信息管理。特点:计算简单,数据量大。特点:计算简单,数据量大。数据管理的特点:数据管理的特点:(1)数据要求长期保存在磁盘上。)数据要求长期保存在磁盘上。(2)数据不再属于某个特定的程序,可重复使用。)数据不再属于某个特定的程序,可重复使用。(3)数据逻辑结构和物理结构有区别;程序与数据之间具)数据逻辑结构和物理结构有区别;程序与数据之
4、间具 有有“设备独立设备独立”。(4)文件组织呈现多样化:索引文件,链接文件和散列文)文件组织呈现多样化:索引文件,链接文件和散列文 件等。件等。文件系统管理数据的缺点:文件系统管理数据的缺点:(1)数据冗余大。数据冗余大。(2)数据操作具有不一致性。)数据操作具有不一致性。(3)数据缺乏独立性。数据缺乏独立性。(4)数据之间联系弱。)数据之间联系弱。(5)数据管理无法实施统一的标准。)数据管理无法实施统一的标准。三三.数据库管理阶段数据库管理阶段 1、特点:、特点:(1)采用了复杂的数据模型表示数据结构。采用了复杂的数据模型表示数据结构。(2)有较高的数据独立性。有较高的数据独立性。数据的逻
5、辑独立:当数据整体逻辑结构改变时,尽量不数据的逻辑独立:当数据整体逻辑结构改变时,尽量不 影响用户的逻辑结构和应用程序影响用户的逻辑结构和应用程序。数据的物理独立:当数据的物理结构改变时,不影响整数据的物理独立:当数据的物理结构改变时,不影响整 体的逻辑结构以及应用程序体的逻辑结构以及应用程序。(3)减少了数据的无控冗余。减少了数据的无控冗余。(4)数据库系统为用户提供了方便的用户接口来使用数据库。数据库系统为用户提供了方便的用户接口来使用数据库。(5)数据操作的基本单位是数据项而不是记录,增强了系统数据操作的基本单位是数据项而不是记录,增强了系统 的灵活性。的灵活性。(6)系统提供了系统提供
6、了4个方面的数据控制功能:数据库的恢复、并发个方面的数据控制功能:数据库的恢复、并发控制、控制、数据完整性和数据的安全性。数据完整性和数据的安全性。2、4个重要的概念个重要的概念 (1)数据库数据库(Database-DB):能为多个用户所共享,具能为多个用户所共享,具有最小冗余有最小冗余 度,数据间联系密切,而又有较高数据独立性的数度,数据间联系密切,而又有较高数据独立性的数据存储库。据存储库。(2)数据库管理系统数据库管理系统(DBMS):位于用户与):位于用户与OS之间的一之间的一层数据管理软件,它能为用户或应用程序提供访问层数据管理软件,它能为用户或应用程序提供访问DB的方法,的方法,
7、包括包括DB 的建立、查询、更新及各种数据控制。的建立、查询、更新及各种数据控制。(3)数据库系统数据库系统(DBS):实现有组织地,动态地存储大量实现有组织地,动态地存储大量关联数据,方便多用户访问计算机软件、硬件和数据资源组成关联数据,方便多用户访问计算机软件、硬件和数据资源组成的系统的系统.(4)数据库技术数据库技术:是一门研究数据库的结构、存储、管理和:是一门研究数据库的结构、存储、管理和使用的软件科学。使用的软件科学。数据描述及联系数据描述及联系一一.三个领域的数据描述三个领域的数据描述 从事物的特性到计算机中的数据表示要经历三个领域:从事物的特性到计算机中的数据表示要经历三个领域:
8、现实世界、信息世界和计算机世界。现实世界、信息世界和计算机世界。1.现实世界:人们头脑之外的客观世界。用文字和符号记载客现实世界:人们头脑之外的客观世界。用文字和符号记载客观世界中的各事物的特性的数据。观世界中的各事物的特性的数据。2.信息世界:信息世界:通过通过归纳、整理、分类等,归纳、整理、分类等,用用表格表格、报表、图表、报表、图表 等格式等格式,记录实现世界中相关数据。记录实现世界中相关数据。常用术语:常用术语:实体实体(entity):客观存在并可相互区别的事物称为实体。):客观存在并可相互区别的事物称为实体。实体集实体集:同类、性质相同的实体的集合。:同类、性质相同的实体的集合。属
9、性属性(attribute):实体的某种特性。实体的某种特性。实体标识符实体标识符:能唯一标识每一个实体的属性或属性集。:能唯一标识每一个实体的属性或属性集。3.计算机世界:信息世界的信息在机内的数据存放形式。计算机世界:信息世界的信息在机内的数据存放形式。常用术语:常用术语:字段字段(field):标记实体属性的命名单位。):标记实体属性的命名单位。记录记录(record):字段的有序集合。):字段的有序集合。文件文件(file):同类记录的汇集。):同类记录的汇集。关键字关键字(key):能唯一标识文件中每个记录的字段或字段集。):能唯一标识文件中每个记录的字段或字段集。信息世界信息世界与
10、与计算机世界计算机世界的术语对应关系的术语对应关系 信息世界信息世界 计算机世界计算机世界 实体实体 记录记录 实体集实体集 文件文件 属性属性 字段字段 实体标识符实体标识符 关键字关键字现实世界的 数 据整理、归纳分类计算机世界的 数 据信息世界的 数 据编码、输入存储三个世界中的数据之间的关系:三个世界中的数据之间的关系:二二.数据联系的描述数据联系的描述 数据联系的数据联系的表现形式表现形式:实体(集)间的联系实体(集)间的联系:指记录(指记录(元组元组)之间的联系。)之间的联系。实体内部的联系:记录(元组)内部字段(实体内部的联系:记录(元组)内部字段(属性属性)间的联系。)间的联系
11、。数据联系数据联系的类型的类型:1对对1的的联系联系。三类:三类:1对多对多的联系。的联系。多对多多对多的联系。的联系。数据联系数据联系的类型的类型是用来表达数据之间的语义关系。是用来表达数据之间的语义关系。1、1对对1联系联系 如果实体集如果实体集E1E1中每个实体至多与实体集中每个实体至多与实体集E2E2中一个实体有联系,中一个实体有联系,反之亦然,则反之亦然,则E1E1对对E2E2称为称为“1 1对对1 1”的联系的联系 ,记为:,记为:1:11:1。E1E2图形表示为:图形表示为:E1E2E1E2或或11例如:夫妻之间的生活关系;汽车与驾驶员的驾驶关系等都是例如:夫妻之间的生活关系;汽
12、车与驾驶员的驾驶关系等都是1:1联系的联系的 实例。实例。2、1对多的联系对多的联系 如果实体集如果实体集E1中每个实体与实体集中每个实体与实体集E2中任意个(零个或多中任意个(零个或多个)实体有联系,而个)实体有联系,而E2中每个实体至多和中每个实体至多和E1中一个实体有中一个实体有联系,则称联系,则称E1与与E2的联系为的联系为“1对多对多”联系,联系,记为:记为:1:n。E1E2图形表示为:图形表示为:E1E1E2E2或或1n例如:校长与师生管理的关系;部门与职工的聘用关系等都是例如:校长与师生管理的关系;部门与职工的聘用关系等都是1:n联系的联系的 实例。实例。3、多对多的联系、多对多
13、的联系 如果实体集如果实体集E1中每个实体与实体集中每个实体与实体集E2中任意个(零个或多中任意个(零个或多个)实体有联系,反之亦然,则称个)实体有联系,反之亦然,则称E1与与E2的联系是的联系是“多对多多对多”的联系,记为的联系,记为n:m。E1E2图形表示为:图形表示为:E1E2E2E1或或n例如:课程与学生的选课关系;教师与学生授课的关系等都是例如:课程与学生的选课关系;教师与学生授课的关系等都是n:m联系的联系的实例。实例。m 注:注:三种联系的关系三种联系的关系:根据根据与之相联系的实体集的个数,将与之相联系的实体集的个数,将联系联系分为:分为:一元联系、二元联系(如前面例子)和三元
14、联系等。一元联系、二元联系(如前面例子)和三元联系等。实体集之间的复杂联系(三元联系):实体集之间的复杂联系(三元联系):1:11:nn:m一元联系:一元联系:一个零件由若干一个零件由若干个子零件组成,个子零件组成,而一个零件又是而一个零件又是其他零件的子零其他零件的子零件。件。供应者工程零件Mmnk零件组装mn 1.2 数据模型数据模型 表示实体类型及实体间联系的模型。表示实体类型及实体间联系的模型。注:注:数据库结构是以数据模型为基础构建的。数据库结构是以数据模型为基础构建的。一、数据模型的分类一、数据模型的分类 (1)概念模型概念模型(语义模型):独立于计算机,用来描述特(语义模型):独
15、立于计算机,用来描述特定组织关心的信息结构,着重信息之间的语义表达,如:实体定组织关心的信息结构,着重信息之间的语义表达,如:实体联系模型(联系模型(ER模型)。模型)。(2)结构模型结构模型:面向:面向DB逻辑结构的模型,如:层次、网状、逻辑结构的模型,如:层次、网状、关系和面向对象模型。关系和面向对象模型。两大类:两大类:u结构模型的组成(结构模型的组成(模型模型3要素要素)数据结构数据结构:实体类型和联系表达与实现;:实体类型和联系表达与实现;数据操作数据操作:检索与更新操作;:检索与更新操作;数据完整性约束数据完整性约束:数据及联系应具有的约束和依赖规则。:数据及联系应具有的约束和依赖
16、规则。应用需求1应用需求2应用需求n概念模型逻辑模型层次模型网状模型关系模型内部模型外部模型1外部模型2外部模型nDBMSDBDB应用程序员现实世界要求完成应用需求综合与抽象构造转换映像映像 支持支持支持支持1.概念模型与结构模型的关系:概念模型与结构模型的关系:2.模型的特点模型的特点 (1)概念模型特点:)概念模型特点:表达了表达了系统用户对应用项目所涉及数据系统用户对应用项目所涉及数据的整体逻辑结构;的整体逻辑结构;概念模型是从概念模型是从用户需求的观点用户需求的观点出发,对数据的建模;出发,对数据的建模;概念模型概念模型独立于独立于计算机计算机硬件硬件和和软件软件;概念模型是概念模型是
17、DB设计人员与设计人员与用户用户进行交流的工具。进行交流的工具。(2)逻辑模型特点:)逻辑模型特点:逻辑模型表达了逻辑模型表达了DB整体整体逻辑结构;逻辑结构;逻辑模型是从逻辑模型是从数据库实现的观点数据库实现的观点出发,对数据的建模;出发,对数据的建模;逻辑模型独立于计算机硬件,逻辑模型独立于计算机硬件,依赖于软件依赖于软件;逻辑模型是逻辑模型是DB设计人员与设计人员与应用程序员应用程序员进行交流的工具。进行交流的工具。逻辑模型主要有三种:逻辑模型主要有三种:网状、层次、关系。网状、层次、关系。(3)外部模型特点:)外部模型特点:外部模型是逻辑模型的逻辑子集;外部模型是逻辑模型的逻辑子集;独
18、立于计算机硬件,独立于计算机硬件,依赖于软件依赖于软件;表达单个用户使用数据库的观点。表达单个用户使用数据库的观点。划分外部模型的优点:划分外部模型的优点:简化了用户的观点;简化了用户的观点;有助于有助于DBDB的安全和保护;的安全和保护;外部模型是对概念模型的支持。外部模型是对概念模型的支持。(4 4)内部模型特点:)内部模型特点:内部模型(物理模型)是内部模型(物理模型)是DBDB最低层的抽象。描述数据在磁盘或最低层的抽象。描述数据在磁盘或磁带上的存储方式。包括:存储设备。存取方法的细节;磁带上的存储方式。包括:存储设备。存取方法的细节;内部模型依赖于软件和硬件;内部模型依赖于软件和硬件;
19、注意:注意:对于层次和网状对于层次和网状DBDB,需要精心设计内部模型。对于,需要精心设计内部模型。对于 关系关系DBDB不必考虑内部模型的设计细节,由不必考虑内部模型的设计细节,由DBMS自动完成。自动完成。物理物理DB是是DB唯一的物理实体唯一的物理实体。二、二、E-R模型模型E-R模型:模型:E-R图表示现实世界中实体及实体间联系的模型。图表示现实世界中实体及实体间联系的模型。用途:用于用途:用于DB概念设计阶段,描述概念设计阶段,描述DB概念模型。概念模型。构成:构成:a)矩形框:其内写上实体名,表示实体类型;矩形框:其内写上实体名,表示实体类型;b)菱形框:其内写上联系名,表示联系类
20、型;菱形框:其内写上联系名,表示联系类型;c)椭圆框:其内写上属性名,表示实体或联系的属性;椭圆框:其内写上属性名,表示实体或联系的属性;d)直线:连接实体,联系及属性框,直线:连接实体,联系及属性框,旁旁边可标注联系的边可标注联系的联系联系(1:1,1:n或或n:m)。)。例:有语义:例:有语义:“一个部门拥有多个仓库,仓库中存放了多种一个部门拥有多个仓库,仓库中存放了多种零件,多种零件存放在不同的仓库中。零件,多种零件存放在不同的仓库中。”画出该语义的画出该语义的E-R图。图。部门号部门名电话号仓库名地址电话号码零件号零件名数量型号部门拥有储存仓库零件1nnm注意:注意:实体间联系实体间联
21、系表达表达了了实体间实体间的的语义关系,语义关系,是是ER模型的重要部分。模型的重要部分。例:某学生宿舍管理系统,涉及的部分信息如下:例:某学生宿舍管理系统,涉及的部分信息如下:学生:学号,姓名,性别,专业,班级。学生:学号,姓名,性别,专业,班级。寝室:寝室号,房间电话。寝室:寝室号,房间电话。管理员:员工号,姓名,联系电话。管理员:员工号,姓名,联系电话。其中:每个寝室可同时住宿多名学生,每名学生只分配一个寝室;其中:每个寝室可同时住宿多名学生,每名学生只分配一个寝室;每个寝室指定其中一名学生担当寝室长;每个管理员同时管理每个寝室指定其中一名学生担当寝室长;每个管理员同时管理多个寝室,但每
22、个寝室只有一名管理员。多个寝室,但每个寝室只有一名管理员。建立一个反映上述局部应用的建立一个反映上述局部应用的E-R模型。模型。解:解:E-R模型如下:模型如下:学生寝 室管理员联 系 电话姓名员工号管理居住负责寝室号房间电话学号姓名性别专业班级1n111n语义(概念)模型描述的优点:语义(概念)模型描述的优点:在高层上直接表达实体间联系的语义,容易理解;易于与在高层上直接表达实体间联系的语义,容易理解;易于与用户交流。用户交流。不涉及数据组织的具体结构,与计算机无关。不涉及数据组织的具体结构,与计算机无关。三、结构模型三、结构模型 层次模型层次模型传统的结构模型:传统的结构模型:网状模型网状
23、模型 关系模型关系模型用树型结构或森林表表示实体及实体联系的模型。用树型结构或森林表表示实体及实体联系的模型。层次模型树型结构:层次模型树型结构:树的结点是记录类型,有且仅有一个无父的结点(树根),树的结点是记录类型,有且仅有一个无父的结点(树根),其它结点仅有一个父结点;其它结点仅有一个父结点;父子结点之间只能是父子结点之间只能是1对多或则对多或则1对对1的联系,不能是多对多。的联系,不能是多对多。1、层次模型、层次模型系号系号系名系名电话电话课号课号课名课名学时学时室号室号室名室名姓名姓名性别性别职称职称A A系系B B教研室教研室C C教员教员D D课程课程模型树模型树1.1.表示实体集
24、表示实体集之间的联系之间的联系2.2.表示实体集表示实体集的定义的定义01计算机计算机754102自控自控2应用应用1软件软件张三张三男男教授教授李四李四女女副教授副教授1 DB502OS483C60a1a1B Bb1b1b2b2C Cc1c1c2c2D Dd1d1d2d2d3d3a2a2值集树值集树相当于模型树相当于模型树的各结点的具的各结点的具体值组成体值组成例:层次模型树结构例:层次模型树结构典型的层次典型的层次DB系统:系统:IMS。特点:特点:层次性层次性:实体:实体 之间的联系是单向的,树任一结点只有唯一之间的联系是单向的,树任一结点只有唯一 一条一条 自根到达它的路径;自根到达它
25、的路径;有序性有序性:从左到右的顺序规则了任一结点所有子树的先后次序;:从左到右的顺序规则了任一结点所有子树的先后次序;原子性原子性:结点中记录的任何属性均不可再分的简单类型数据;:结点中记录的任何属性均不可再分的简单类型数据;父子结点之间至多是父子结点之间至多是1对多(或对多(或1对对1)的联系。)的联系。优点:层次模型的优点:层次模型的DB中,结点记录之间是通过指针联系,查询中,结点记录之间是通过指针联系,查询效率高。效率高。缺点:缺点:结点之间的联系只能是结点之间的联系只能是1对多,因此,对于多对多联对多,因此,对于多对多联 系需要转换系需要转换,且转换较为复杂。且转换较为复杂。由于树的
26、层次性和顺序性的要求,引起数据查询和由于树的层次性和顺序性的要求,引起数据查询和更新操作较为复杂。更新操作较为复杂。2、网状模型、网状模型网状模型网状模型DB的结构(的结构(DBTG报告中的网状模型,简单模型)报告中的网状模型,简单模型)用记录类型为结点的网状来表示实体与实体间用记录类型为结点的网状来表示实体与实体间1对多联系的模对多联系的模型。型。例:例:n有多个无父结点。一个结点有多个无父结点。一个结点可能有多个父结点可能有多个父结点n父子结点之间至多是父子结点之间至多是1:m的联系,不能直接表达的联系,不能直接表达n:m联系。联系。所以,层次所以,层次DB模型是模型是DBTG中网状模型的
27、特殊形式。中网状模型的特殊形式。职称职称性别性别姓名姓名分数分数课号课号学号学号出生年月出生年月姓名姓名学号学号学时学时课名课名课号课号1 1M M1 1M M1 1M M教学管理系统教学管理系统优点:记录之间用指针连接,查询效率高优点:记录之间用指针连接,查询效率高.缺点:编写应用程序复杂,程序员必须熟知缺点:编写应用程序复杂,程序员必须熟知DB的逻辑结构。的逻辑结构。典型网状典型网状DBS:TOTAL DMS1100 IDMS IDS/3、关系模型、关系模型用二维表格结构表达实体集,用外关键字表示实体间联系的模用二维表格结构表达实体集,用外关键字表示实体间联系的模型。型。关系模型:关系模式
28、组成的集合。关系模型:关系模式组成的集合。1、关系模型的物理概念、关系模型的物理概念 关系就是俗称的二维表:关系就是俗称的二维表:学号学号姓名姓名性别性别系名系名专业名专业名2001120012 .王一王一张三张三 .男男女女 .计算机计算机物理物理 .软件软件地球物理地球物理 .学生登记表学生登记表属性(字段)属性(字段)元组元组(记录值)(记录值)属性值集属性值集n表头:称为关系的框架,即为属性集。表头:称为关系的框架,即为属性集。n构成模式:学生(学号,姓名,性别,系名,专业名)构成模式:学生(学号,姓名,性别,系名,专业名)n关系模型的数学概念:笛卡尔积中有意义的子集称为关系。关系模型
29、的数学概念:笛卡尔积中有意义的子集称为关系。n必须满足下列条件的二维表:必须满足下列条件的二维表:表中的表中的每一列是不可再分的基本数据项(初等项)。每一列是不可再分的基本数据项(初等项)。每列指定一个相异的名称,类型相同。每列指定一个相异的名称,类型相同。各行相异不允许重复(无重复的元组)。各行相异不允许重复(无重复的元组)。列行次序无关紧要。列行次序无关紧要。n主要的关系主要的关系DBMS产品:产品:Oracle、DB2、Sybase、SQL Server、MySQL等。等。女女82.1李芳李芳0008男男82.10王立王立0001性别性别出生年月出生年月姓名姓名学号学号学生关系学生关系课
30、程关系课程关系40OS250DB1学时数学时数课名课名课号课号学习关系学习关系851000880200019010001分数分数课号课号学号学号直接表达直接表达n:m联系联系:通过关系或外关键通过关系或外关键字联系。字联系。关系之间的联系关系之间的联系2、关系模型与层次模型,网状模型的差别:、关系模型与层次模型,网状模型的差别:用关键字而不是用指针导航数据(建立联系);用关键字而不是用指针导航数据(建立联系);关系模型具有严密的数学基础和操作的代数性质,网状、层关系模型具有严密的数学基础和操作的代数性质,网状、层次无;次无;简单灵活地表达实体间的复杂关系;简单灵活地表达实体间的复杂关系;表格简
31、单、易懂,编程方便,不涉及到存储结构和访问的细表格简单、易懂,编程方便,不涉及到存储结构和访问的细节。节。四四.E-R模型与结构模型的转换关系模型与结构模型的转换关系E-R模型属于语义模型,独立于机器,用于信息世界描述实体及模型属于语义模型,独立于机器,用于信息世界描述实体及实实体之间的联系。体之间的联系。E-R模型很方便地转换成结构模型中之一个模型:模型很方便地转换成结构模型中之一个模型:关系模型关系模型E-R模型:模型:E1E2R层次层次模型模型网状模型网状模型面向对面向对象模型象模型转换规则转换规则1.3 数据库系统结构数据库系统结构一一.数据库系统的体系结构数据库系统的体系结构最终用户
32、所看到的数据库系统使用方式下的结构形式,可分为:最终用户所看到的数据库系统使用方式下的结构形式,可分为:集中式、分布式、客户机集中式、分布式、客户机服务器服务器等。等。1.集中式数据库系统结构集中式数据库系统结构 集中式数据库系统可分为:集中式数据库系统可分为:单用户和多用户系统单用户和多用户系统。(1)单用户数据库系统)单用户数据库系统在单用户系统中,数据库、在单用户系统中,数据库、DBMS和应用程序都装在一台计算机和应用程序都装在一台计算机上,由一个用户独占,并且系统一次只能处理一个用户的请求。上,由一个用户独占,并且系统一次只能处理一个用户的请求。(2)多用户数据库系统)多用户数据库系统
33、多用户数据库系统指在一个主机中集中存放数据库、多用户数据库系统指在一个主机中集中存放数据库、DBMS和应和应用程序,供多个与之相联系的终端用户并发地共同使用数据库,由用程序,供多个与之相联系的终端用户并发地共同使用数据库,由一个处理机同时处理多个用户事务的活动。一个处理机同时处理多个用户事务的活动。DBMSOSDB主机终端1终端n 集中式的数据库系统体系结构2.分布式数据库系统结构分布式数据库系统结构 指数据库被划分逻辑关联而物理分布在计算机网络不同场地指数据库被划分逻辑关联而物理分布在计算机网络不同场地(又称结点)的计算机中,并具有(又称结点)的计算机中,并具有 整体操作与分布控制数据能力整
34、体操作与分布控制数据能力的数据库系统。的数据库系统。场地1通信网络 场地2场地3 分布式数据库系统体系结构计算机 系统计算机 系统计算机 系统在分布式数据库系统中,一般每个场地是一个集中式数据库系在分布式数据库系统中,一般每个场地是一个集中式数据库系统,它们都有独立处理能力并能完成局部应用;而每一个场地统,它们都有独立处理能力并能完成局部应用;而每一个场地的系统也参与全局应用程序的执行,全局应用程序可通过网络的系统也参与全局应用程序的执行,全局应用程序可通过网络访问系统中多个场地的数据。访问系统中多个场地的数据。分布式数据库系统的特点:分布式数据库系统的特点:分布性:分布性:数据库中的数据分布
35、地存储在不同的场地。(有别于数据库中的数据分布地存储在不同的场地。(有别于集中式数据库)集中式数据库)自治性:自治性:每个场地是一个自主独立的数据库系统,即为集中式每个场地是一个自主独立的数据库系统,即为集中式数据库系统。(有别于分散式数据库)数据库系统。(有别于分散式数据库)全局性:全局性:各自治站点协同工作使数据库逻辑上成为一个整体,各自治站点协同工作使数据库逻辑上成为一个整体,以支持各用户的全局应用。(有别于网络的分散式数据库)以支持各用户的全局应用。(有别于网络的分散式数据库)3.客户机客户机服务器数据库系统结构服务器数据库系统结构客户机客户机服务器(服务器(clientServer,
36、简称,简称CS)数据库系统将数据库系统将DBMS功能管理程序单独存放到网络中某个或某些场地的计算机中,功能管理程序单独存放到网络中某个或某些场地的计算机中,而将用户应用程序安装到其余场地的计算机中。而将用户应用程序安装到其余场地的计算机中。安装安装DBMS功功能管理程序系统的计算机称为数据库服务器,简称服务器;存能管理程序系统的计算机称为数据库服务器,简称服务器;存储用户应用程序的计算机称为客户机。储用户应用程序的计算机称为客户机。在客户机在客户机服务器数据库系统中,服务器数据库系统中,客户机通过计算机网络向服务器客户机通过计算机网络向服务器提出计算请求,服务器经过计算,将结果返回客户机,减少
37、了网提出计算请求,服务器经过计算,将结果返回客户机,减少了网上数据的传输量,提高了系统的性能、吞吐量和负载能力。上数据的传输量,提高了系统的性能、吞吐量和负载能力。客 户 机 表格处理 图形接口 报告生成 应用工具接口通信网络 查询处理 事务处理 存储管理DB服 务 器 客户机服务器数据库系统体系结构n三级模式和两级变换结构三级模式和两级变换结构 模式是由结构模型用语句定义而来:外模式、模式和内模式。模式是由结构模型用语句定义而来:外模式、模式和内模式。两级变换:外模式两级变换:外模式/模式、模式模式、模式/内模式。内模式。、外模式1 外模式2外模式n模 式内模式DBMSOSDB外模式/模式映
38、象1外模式/模式映象2外模式/模式映象n模式/内模式映象I/O视图视图DBA建立建立和维和维护护DB系统结构系统结构二二.数据库系统结构数据库系统结构1、三级模式结构、三级模式结构 外模式(子模式,用户模式):由外部模型定义而来。外模式(子模式,用户模式):由外部模型定义而来。概念模式(模式):由逻辑模型定义而来。概念模式(模式):由逻辑模型定义而来。内模式(物理模式,存储模式):由内部模型定义而来。内模式(物理模式,存储模式):由内部模型定义而来。外模式(外模式(external schema)外模式:是外模式:是用户与用户与DBS的接口,是单个用户所使用的那一部分数据视图的接口,是单个用户
39、所使用的那一部分数据视图的描述。的描述。程序员程序员表现形式:表现形式:DB局部数据的逻辑结构局部数据的逻辑结构,由若干外部记录类型组成。,由若干外部记录类型组成。(I/O与视图区别:数据,命名,组合,次序,种类等不同)与视图区别:数据,命名,组合,次序,种类等不同)外模式通过外模式通过“外模式外模式DDL”定义,并通过数据库操纵语言定义,并通过数据库操纵语言DML操纵。操纵。一个一个DB由若干个子模式由若干个子模式,为多个应用程序共享。为多个应用程序共享。概念模式(概念模式(conceptual schema)n概念模式(概念模式(conceptual schema):DB中全部的整体数据中
40、全部的整体数据逻辑视图逻辑视图的描述。的描述。DBAn表现形式:表现形式:DB全局数据逻辑描述:数据名、类型、记录间全局数据逻辑描述:数据名、类型、记录间的联系,操作,完整性,安全性要求。的联系,操作,完整性,安全性要求。n概念模式通过概念模式通过“模式模式DDL”定义:定义:子模式是模式的逻辑子集;子模式是模式的逻辑子集;DBS中只有一个模式中只有一个模式它是子它是子模式的合成。均不涉及存储结构及访问技术等细节。模式的合成。均不涉及存储结构及访问技术等细节。子模式与模式可能有若干差别:数据名,次序,数据的子模式与模式可能有若干差别:数据名,次序,数据的类型等。类型等。模式模式/子模式之间映象
41、由子模式之间映象由DBMS完成。完成。内模式(内模式(internal schema)内模式:内模式:DB在物理存储方面的描述,是在物理存储方面的描述,是物理存储数据视图物理存储数据视图的描述。的描述。表现形式:表现形式:DB内部记录类型,索引和文件组织方式及控制的的描内部记录类型,索引和文件组织方式及控制的的描述细节。述细节。内模式通过内模式通过“内模式内模式DDL”定义。定义。内模式只有一个,内模式内模式只有一个,内模式/模式映象由模式映象由DBMS完成。完成。2、两级变换、两级变换外模式外模式/模式映象:模式映象:DBMS定义外模式与概念模式间的对应性定义外模式与概念模式间的对应性(内部
42、记录与外部记录的对应性)(内部记录与外部记录的对应性)模式模式/内模式映象:定义模式与内模式之间的对应性。由于数据内模式映象:定义模式与内模式之间的对应性。由于数据中记录类型,字段类型,命名组成可能不一样,需要说明概念记中记录类型,字段类型,命名组成可能不一样,需要说明概念记录和内部记录的对应关系。录和内部记录的对应关系。三级模式和两级变换结构的主要优点:三级模式和两级变换结构的主要优点:提供了提供了数据独立性。数据独立性。二、数据两级独立性二、数据两级独立性 数据的物理独立性数据的物理独立性 数据的逻辑独立性数据的逻辑独立性分为:分为:1、数据的物理独立性、数据的物理独立性DBS中对中对DB
43、的内模式的修改尽量不影响概念模式的修改,称数据具有物理独的内模式的修改尽量不影响概念模式的修改,称数据具有物理独 立性。立性。如:如:DB的存储设备和存取方法有所变化,使模式的存储设备和存取方法有所变化,使模式/内模式映象进行相应修改,内模式映象进行相应修改,但概念模式尽可能保持不变。但概念模式尽可能保持不变。2、数据的逻辑独立性、数据的逻辑独立性对对DB 的概念模式的修改,尽量不影响外模式和应用程序的变化,称数据具有的概念模式的修改,尽量不影响外模式和应用程序的变化,称数据具有逻辑独立性。逻辑独立性。概念模式修改如增加记录类型或数据项,外模式概念模式修改如增加记录类型或数据项,外模式/概念模
44、式映象随之相应修改,概念模式映象随之相应修改,但使外模式尽可能保持不变。但使外模式尽可能保持不变。三、用户界面三、用户界面I/O视图是用户的界面,通过数据操纵语言(视图是用户的界面,通过数据操纵语言(DML)编写的)编写的程序而完成的图表等数据显示或打印形式。程序而完成的图表等数据显示或打印形式。自含型自含型DML:编程语言本身含有:编程语言本身含有DML语句,语句,DML两种方式:两种方式:如:如:FoxPro。宿主型宿主型DML:DML嵌入到高级语言(如嵌入到高级语言(如C等)中等)中 使用,如:使用,如:SQL语言。语言。一、一、DBS的组成的组成 数据库(数据库(DB):存放在磁盘中的
45、物理数据库。):存放在磁盘中的物理数据库。硬件:硬件:DBS的物理支持。的物理支持。DBMS:DBS管理功能的体现管理功能的体现 其它软件(其它软件(OS等):等):DBS的软件支持的软件支持 终端用户:使用程序的非计算机人员。终端用户:使用程序的非计算机人员。人员:人员:专业人员:数据库设计的上层人员如系统分析员专业人员:数据库设计的上层人员如系统分析员 程序员:编写应用程序的人员。程序员:编写应用程序的人员。数据库管理员(数据库管理员(DBA:database administrator):DBS责任的承担者。责任的承担者。软件:软件:DBS的组成:的组成:1.5 数据库系统的组成数据库系
46、统的组成1、DBn一个组织中一个组织中,与各项应用有关的全部数据集合。与各项应用有关的全部数据集合。应用数据的集合,称为物理库。应用数据的集合,称为物理库。各项数据结构的描述,称为描述库,由各项数据结构的描述,称为描述库,由DD系统管理。系统管理。磁盘中存储的数据结构:磁盘中存储的数据结构:5种:种:数据文件数据文件:应用数据的:应用数据的DB文件。文件。数据字典数据字典:存储:存储DB三级模式及数据完整性约束。三级模式及数据完整性约束。索引:索引:优化查询提高速度而设置的排序文件。优化查询提高速度而设置的排序文件。统计数据:统计数据:存储存储DBS运行时统计分析的数据。供查询分析器有效处理查
47、询。运行时统计分析的数据。供查询分析器有效处理查询。日志:日志:存储存储DBS运行时对运行时对DB的操作情况。供查询的操作情况。供查询DB使用情况和数据恢复。使用情况和数据恢复。n组成:组成:2、硬件、硬件n包括:包括:CPU、内存、外存、内存、外存、I/O设备、数据通讯设备等。设备、数据通讯设备等。nDBS关注的是:内存、外存、关注的是:内存、外存、I/O存取速度,可支持终端数和性能稳定存取速度,可支持终端数和性能稳定 性等指标。性等指标。3、软件、软件OS:支持:支持DBMS存取数据。存取数据。宿主语言及对应的编译系统。宿主语言及对应的编译系统。数据通讯软件。数据通讯软件。用户开发的应用程
48、序。用户开发的应用程序。集成的集成的DB管理软件:报表生成器,管理软件:报表生成器,DB辅助设计工具软件,辅助设计工具软件,数据库测试工具,图形系统,数据库测试工具,图形系统,I/O交换设施等。交换设施等。DBMS系统(下面介绍)系统(下面介绍)包括:包括:关系:关系:DB及硬件及硬件OSDBMS/编译系统编译系统集成的集成的DB管理软件管理软件应用程序应用程序4、人员、人员(1)DBA承担创建,监控和维护整个承担创建,监控和维护整个DB结构的责任:结构的责任:模式定义模式定义 内模式定义内模式定义 修改修改DB的模式和内模式的模式和内模式 对对DB访问的授权访问的授权 完整性约束的说明完整性
49、约束的说明 通过一系列使用程序完成:通过一系列使用程序完成:DBMS装载、重组、日志、恢复、统计分析。装载、重组、日志、恢复、统计分析。通过通过DD系统,掌握系统的工作情况。系统,掌握系统的工作情况。DBA与与DBMS的界面是数据库模式。的界面是数据库模式。DBA:(2)专业用户:使用专用的)专业用户:使用专用的DB查询语言操作数据。查询语言操作数据。专业用户与专业用户与DBMS的界面是数据库查询工具。的界面是数据库查询工具。(3)应用程序员:使用)应用程序员:使用DML编写应用程序。编写应用程序。应用程序语言:应用程序语言:C,C+,JAVA等。或者软件开发工具:等。或者软件开发工具:Del
50、phi、PowerBuilder(PB)、)、VisualBasic(VB)或)或VC、NET等。等。应用程序员与应用程序员与DBMS的界面是应用程序。的界面是应用程序。(4)终端用户:使用程序人员。)终端用户:使用程序人员。终端用户与终端用户与DBMS的界面是应用程序运行后的的界面是应用程序运行后的I/O界面。界面。二、二、DBMS1、DBMS的主要功能的主要功能DBMS是是DBS中重要的核心软件。中重要的核心软件。DBMS的主要功能:的主要功能:(1)DB的定义功能的定义功能 DBMS提供的数据定义语言(提供的数据定义语言(DDL):):定义定义DB的三级模式的三级模式:外模式,概念模式,