《第06章技术基础篇数据处理(第三讲)PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第06章技术基础篇数据处理(第三讲)PPT讲稿.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第06章技术基础篇数据处理(第三讲)第1页,共69页,编辑于2022年,星期日二、数据处理的发展阶段1.手工处理2.机械设备处理3.计算机系统处理由算盘、计算尺、手摇计算机等进行处理由卡片、制表设备等进行处理完全由计算机系统进行处理第2页,共69页,编辑于2022年,星期日三、数据处理的基本内容1.数据收集(数据采集)(1)定义:数据收集就是按照用户的需要和系统的要求收集必要的原始数据(2)收集方式人工收集 联机方式收集比较:人工方式及时性差,出错率高;联机方式快速、准确,但投资较大。联机方式是数据采集的发展方向由人通过一定的中间环节获得数据(如档案文件、帐册、票据凭证等)。要对数据的来源和数
2、据本身的准确性充分了解,以保证引用资料的准确性。将某种计算机装置、测试装置等直接与电子数据处理系统相联接,将所需数据直接送入计算机处理系统,由计算机直接处理。第3页,共69页,编辑于2022年,星期日2.数据加工处理(1)数据的转换和录入数据转换:也叫数据的预处理,是将采集到的原始数据通过一定手段转换成适合于计算机处理的形式,使数据代码化。原始数据的分类:原始数据的分类:数值型数据:由数字字符组成,可直接进行数据录入文字信息或特定符号:必须预先经过“编码”处理才能录入l数据录入方法:传统手工方法;传统手工方法;源数据自动化源数据自动化方法。方法。第4页,共69页,编辑于2022年,星期日(2)
3、数据分类和合并分类:根据一定顺序将无序的数据元素序列调整成为一个有序序列,也就是将数据元素按某一关键字进行排序,形成一个有序文件。合并:将两个或多个简单有序集合中的数据项目按同样的顺序连接成一个有序集合。第5页,共69页,编辑于2022年,星期日3.数据传输数据传输有两层含义实现数据资源的共享与交换数据处理结果的输出如:利用计算机通信网络共享各网点的数据资源。常以报告、文件图表等形式输出给各用户,并传送到各部门。第6页,共69页,编辑于2022年,星期日4.数据存储l数据存储:是对原始待加工的数据及已加工的各种信息的储存 涉及的两个问题物理存储:将数据存储在适当的介质上逻辑组织:按数据逻辑内在
4、联系和使用方式,把数据组成合理的结构第7页,共69页,编辑于2022年,星期日5.数据管理 数据管理就是对数据的更新和维护,也就是指对原文件中的记录或数据项进行修改、插入(增加)、删除及数据存储的调整,数据正确性的检查和安全性的保证等。第8页,共69页,编辑于2022年,星期日更新过程录入更新更新新文件更新文件旧文件第9页,共69页,编辑于2022年,星期日6.数据检索l数据检索即从计算机存储数据中查找和选取所需要的数据l采用何种方式检索,取决于数据存储的形式数据处理的核心是数据处理的核心是数据收集和数据管理数据收集和数据管理第10页,共69页,编辑于2022年,星期日四、文件组织只有将数据有
5、序地组织起来,才能对数据进行有效地处理。1.数据组织的层次数据组织的层次数据按照层次方式进行组织由(位、字节、)字段、记录、文件、数据库(、数据仓库)组成n位(Bit):是计算机中最小的数据单位,其值为0或1,是一个二进位,表示一个导通或未通的电(光)路。n字节(Byte):字节(Byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。第11页,共69页,编辑于2022年,星期日n字段(Field,也称数据项)。多个字符组成一个词或者一个完整的数字(如人名或年龄)字段是数据的最小单位,它不能再分成有意义的单位n记录(Record):由与某个特殊对象或活动有关
6、的所有字段组成。n文件(File)同一类型的所有记录组成一个文件文件就是与某个特定主题相关的数据记录的集合。n数据库(Database):逻辑相关文件的集合。n数据仓库(Datawarehouse):由多个数据库中的信息抽取组合构成。第12页,共69页,编辑于2022年,星期日(字母J的ASCII码)数据的层次数据的层次举例举例文件字节字段记录01001010900811刘汉云 2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期职员文件(名字字段)职员文件部门文件财务文件900811刘汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 200
7、1-8-2第13页,共69页,编辑于2022年,星期日2.文件的组织方式 文件是数据库组织的基础,任何对数据库的操作最终均转化为对数据文件的操作。文件的组织方式直接影响整个信息系统的效率。(1)概念)概念 文件的组织方式是指文件中的记录或数据在存储介质上的排列方式。一般按其内部结构大致分为串行组织、顺序组织、随机组织、索引组织、倒排组织和链表组织等方式。第14页,共69页,编辑于2022年,星期日(2)分类n串行组织串行组织l是最简单的一种文件组织形式,它将记录按出现的顺序一个接一个地存放在存储器的某个区中,取用某个记录时只能顺序扫描整个文件。l较多用于计算机运行过程中产生的暂时文件以及存档文
8、件。l适用于磁带存储器。l串行组织文件简称为串行文件。第15页,共69页,编辑于2022年,星期日n顺序组织顺序组织l指文件中各记录根据关键字(值)以升序或降序的形式存放在存储介质上的组织形式。l是经过整理的串行文件。l数据记录的逻辑顺序和物理顺序是一致的。l其存取只能以顺序方式进行,不能任意对某个记录进行直接存取。l适用于拥有大量记录,且变化不频繁的文件;也适用于成批数据顺序存取的场合。l可存储在顺序介质和随机存取介质上。l顺序组织文件简称顺序文件。第16页,共69页,编辑于2022年,星期日n随机组织随机组织l指文件中各个记录与其在存储介质上的存放位置之间毫无关系的组织方式。l用一种算法将
9、记录的键值转换为一个近乎随机的数,根据这个确定记录在存储器上的位置。l只要确定了某个记录的存储地址(记录键),就可以直接对其进行存取,不必考虑与其他记录之间的顺序关系。l只能存储在磁盘等随机存储设备上,不能存储在磁带等顺序存储设备上。l可用于联机处理的场合,实现快速地对数据进行随机存取及查询;不适用于文件中大部分记录都需要处理的情况。l随机组织文件简称为随机文件。第17页,共69页,编辑于2022年,星期日n索引组织索引组织l是把文件中识别各个记录的关键字集中在一起组成一个目录文件(即索引表)的组织方式。l由索引表(简称索引)与主文件两个部分组成。l适用于批处理及联机处理。l优点是既可用于顺序
10、操作,也可用于随机操作l缺点是当文件量较大时,目录文件增多,所占存储空间增大。l索引组织文件简称索引文件第18页,共69页,编辑于2022年,星期日n倒排文件倒排文件l是对每个辅关键字都设立一个索引,每种关键字值对应一个索引项,将具有相同关键字值记录地址都保存在相应的索引项中的组织方式。l倒排组织中,记录有多个键值,根据这些键值来确定一个记录。l可以把倒排组织文件视为“多键值索引文件”。l倒排组织文件简称倒排文件第19页,共69页,编辑于2022年,星期日倒排文件倒排文件 举例举例基于属性的倒排基于属性的倒排在一个带结构的记录文件中,如数据库文件等。文件里存放的都是一条接着一条的整齐的记录,每
11、个记录又可分为一个个的属性。检索过程往往要求找出,在某个或者某些属性上满足一定条件的记录集合。像这一类的检索我们称为基于属性的检索。比如北大里某次活动的学生报名登记表文件,部分信息如下:001 xxx142 张三 男 18 元培 002 xxx205 李四 女 17 哲学 003 xxx187 王五 男 19 生物 004 xxx325 赵六 女 18 元培 而我们利用倒排文件来实现上述非关键码的查询,就能大大提高速度。对于前面的情况设计倒排表如下:第20页,共69页,编辑于2022年,星期日 男 001,003 女 002,004 16 17 002 18 001,004 19 003 20
12、 元培 001,004 生物 003 哲学 002 第21页,共69页,编辑于2022年,星期日由此可见,有了倒排文件,我们就可以将查询变成几个集合之间的交,并等运算,得到的最后结果即时我们要求的,这样不用挨个读取记录,且参与运算的数据大大减少,基本可以不用多次读写磁盘而直接在内存里进行运算,大大提高了检索速度。有了这样的倒排表后,前面的查询就很容易了。如找出院系为“元培”的所有学生(简单查询),可以在院系倒排表中,取出属性值为“元培”的那一行倒排表,它里面包含的所有编号对应的记录就是所求的记录。又如找出年龄在18到20之间的所有学生(范围查询),我们可以把年龄倒排表中18,19和20这三行所
13、对应的三个编号集合做并运算,最后结果就是我们要找的。而找出年龄在19岁以上的所有男生(逻辑查询),这个我们找出19岁以上的所有编号集合,用并运算合在一起,再同性别倒排表中的男生那一行的集合做与运算,最后就能得到正确结果。第22页,共69页,编辑于2022年,星期日n链表组织链表组织l是记录之间互相用指针连接的组织方式。l指针是特殊的数据项,指出另一记录在存储器上的位置,同时也反映了数据记录之间的联系,它不代表任何属性。l一组记录可提供几组指针,形成不同的逻辑文件,存取记录十分方便。l链表组织文件简称链表文件。第23页,共69页,编辑于2022年,星期日第第6 6章(章(part2part2)数
14、据库技术数据库技术一、数据库系统的产生一、数据库系统的产生 1.人工处理阶段(50S中期以前)l没有软件支持,程序员直接管理数据。没有软件支持,程序员直接管理数据。l数据保存在处理程序中或随程序执行人机交数据保存在处理程序中或随程序执行人机交互地输入,数据处理后将结果输出,最后数互地输入,数据处理后将结果输出,最后数据和程序占据的内存空间被一起释放。据和程序占据的内存空间被一起释放。l只有程序文件的概念,数据的组织方式由程只有程序文件的概念,数据的组织方式由程序自行设计和安排。序自行设计和安排。l问题:编程效率低,程序依赖数据,不灵活,问题:编程效率低,程序依赖数据,不灵活,容易出错。容易出错
15、。第24页,共69页,编辑于2022年,星期日人工管理方式应用程序 A文件A应用程序 B文件B应用程序 C文件C第25页,共69页,编辑于2022年,星期日 2.文件管理阶段(50S后期)l程序与数据具有设备独立性,可长期保存在外存程序与数据具有设备独立性,可长期保存在外存储器上,构成程序文件和数据文件。储器上,构成程序文件和数据文件。l数据不属于某个特定的程序,允许重复使用。数据不属于某个特定的程序,允许重复使用。l数据文件的结构仍取决于特定的应用,程序与数据间数据文件的结构仍取决于特定的应用,程序与数据间的依赖关系并未根本改变。的依赖关系并未根本改变。l缺点:数据冗余,数据文件间缺乏联系,
16、修改时缺点:数据冗余,数据文件间缺乏联系,修改时容易导致数据的不一致性;数据文件面向应用,容易导致数据的不一致性;数据文件面向应用,当数据结构改变时,程序维护便成为系统的主要当数据结构改变时,程序维护便成为系统的主要矛盾。矛盾。第26页,共69页,编辑于2022年,星期日文件管理方式文件管理方式程序程序A程序程序C程序程序B文件管文件管理系统理系统文件文件B文件文件C文件文件A1文件文件A2第27页,共69页,编辑于2022年,星期日 3.数据库阶段(60S后期)l数据库技术的出现标志着数据资源管理进入数据库阶段。数据库系统的出现,使数据管理进入了一个新阶段。l由于使用数据库管理系统来专门管理
17、数据,实现了数据与程序的真正独立性,并且最大限度地降低了数据的冗余度。l充分实现数据在不同应用中的共享,且能并发地使用数据,对数据的安全保密和完整性也有了保证措施。第28页,共69页,编辑于2022年,星期日数据库管理方式数据库管理方式程序程序A程序程序C程序程序B数据库数据库管理系统管理系统数数据据库库第29页,共69页,编辑于2022年,星期日数据库系统数据库系统数据库系统:数据库系统:数据库与数据库管理系统数据库与数据库管理系统 的有机结合的有机结合;1.数据库:数据库:逻辑上相关的记录和文件的集合。逻辑上相关的记录和文件的集合。2.数据库管理系统:数据库管理系统:是一组计算机程序,控制
18、并组是一组计算机程序,控制并组 织用户的数据库的生成、维护和使用。织用户的数据库的生成、维护和使用。由数据、硬件、软件和用户四部分组成由数据、硬件、软件和用户四部分组成;用户可通过数据库管理系统对数据进行添加、修改、用户可通过数据库管理系统对数据进行添加、修改、删除、检索、存储、统计等多种操作。删除、检索、存储、统计等多种操作。第30页,共69页,编辑于2022年,星期日二、数据库系统的结构二、数据库系统的结构美国国家标准学会(ANSI)于1975年规定了数据库按三级体系结构组织的标准,也就是有名的SPARC分级结构(standard planning and requirement comm
19、ittee)。三级结构以内层(内模式)、中间层(模式)和外层(外模式)三个层次描述数据库。第31页,共69页,编辑于2022年,星期日数据库的三级结构数据库的三级结构第32页,共69页,编辑于2022年,星期日数据库管理系统中的模式n n物物物物理理理理模模模模式式式式:也也称称内内模模式式,描描述述数数据据的的物物理理存存储储形形式式,直接与操作系统或硬件相联系。直接与操作系统或硬件相联系。n n逻逻逻逻辑辑辑辑模模模模式式式式:也也称称模模式式,数数据据库库数数据据的的完完整整表表示示,是是所所有有用用户户的的公公共共数数据据视视图图。模模式式仅仅仅仅涉涉及及数数据据类类型型的的描描述述,
20、不涉及具体的数据值。不涉及具体的数据值。n n用用用用户户户户模模模模式式式式:也也称称子子模模式式或或叫叫外外模模式式,针针对对每每一一个个用用户户或或应应用用,又又由由模模式式导导出出若若干干个个子子模模式式。子子模模式式是是直直接接面面向向用用户户的的,用用户户能能够够看看见见并并使使用用的的是是逻逻辑辑结结构构的的局局部部数数据据描描述述。每每一一个个子子模模式式都都是是模模式式的的一一个个子子集集;也也可可以以看看作作是是模模式式的的一一个个窗窗口口。一一个个数数据据库库系系统统可可以以有有多多个子模式。个子模式。第33页,共69页,编辑于2022年,星期日两级映射可保证三种模式之间
21、的相互独立性两级映射可保证三种模式之间的相互独立性n模式与子模式之间的映射模式与子模式之间的映射 把概念数据库与用户级数据库联系起来n模式与内模式之间的映射模式与内模式之间的映射 把概念数据库与物理数据库联系起来第34页,共69页,编辑于2022年,星期日三、数据模型三、数据模型模型模型:对现实世界事物特征的模拟和抽象就对现实世界事物特征的模拟和抽象就是这个事物的模型。是这个事物的模型。计算机不能直接处理现实世界中的具体计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换为抽象的事物,所以必须先把具体事物转换为抽象的模型,然后再将其转换为计算机可以处理的模型,然后再将其转换为计算机
22、可以处理的数据,从而以模拟的方式实现对现实世界事数据,从而以模拟的方式实现对现实世界事物的处理。物的处理。第35页,共69页,编辑于2022年,星期日模型应满足以下要求:模型应满足以下要求:n n真实地反映现实世界;真实地反映现实世界;n n易被人理解;易被人理解;n n便于在计算机上实现;便于在计算机上实现;第36页,共69页,编辑于2022年,星期日数据模型:数据模型:是用来描述数据及数据间关系的一组概念,数据描述包括两个方面:数据的基本结构、数据间的联系和数据的约束等静态属性;数据上的操作之类的动态属性。数据模型分为三级:数据模型分为三级:概念数据模型:概念数据模型:是面向用户、面向现实
23、世界的数据模型,与DBMS无关,它描述一个组织的概念化结构,如实体关系模型。逻辑数据模型:逻辑数据模型:是用户从数据库中看到的数据模型,与所选用的DBMS相关,也称数据库模型数据库模型。常见的有:层次模型、网状模型、关系模型。物理数据模型:物理数据模型:反映数据存储结构的模型,不仅与DBMS有关,而且还与操作系统有关。具体描述数据如何组织、如何存储在物理介质上。第37页,共69页,编辑于2022年,星期日数据库模型分为三级:数据库模型分为三级:层次模型:层次模型:以树状结构描述数据,数据元素组成的记以树状结构描述数据,数据元素组成的记录称为节点,最上层的节点称为根,上下层节点之间的关录称为节点
24、,最上层的节点称为根,上下层节点之间的关系为父系为父-子关系,一个父节点可有多个子节点,而一个子关系,一个父节点可有多个子节点,而一个子节点只能有一个父节点。子节点只能有一个父节点。第38页,共69页,编辑于2022年,星期日网状模型:网状模型:描述多对多的数据逻辑关系,即父节点描述多对多的数据逻辑关系,即父节点可以有多个子节点,节点也可以有多个父节点。可以有多个子节点,节点也可以有多个父节点。第39页,共69页,编辑于2022年,星期日关系模型:关系模型:用二维表格用二维表格(关系关系)来表示数据库中的所有来表示数据库中的所有数据。数据。三类数据库模型的优缺点:三类数据库模型的优缺点:层次模
25、型的主要优点在于其处理效率,但在数据组织层次模型的主要优点在于其处理效率,但在数据组织上缺乏灵活性,修改困难,且不易安装。上缺乏灵活性,修改困难,且不易安装。网状模型灵活性很大,但数据关系复杂,很难开发网状模型灵活性很大,但数据关系复杂,很难开发和使用。和使用。关系模型是应用最广泛的数据模型,数据组织直观,关系模型是应用最广泛的数据模型,数据组织直观,查询方便,主要缺点是处理效率低。查询方便,主要缺点是处理效率低。第40页,共69页,编辑于2022年,星期日四、实体、属性和联系四、实体、属性和联系实体实体(entity):客观存在、并且可以互相区别的事物称为实体。实体是相关的一类事物,可以是物
26、、人、实际的东实体是相关的一类事物,可以是物、人、实际的东西、或者具体的东西。例:西、或者具体的东西。例:员工、库存、客户、订单员工、库存、客户、订单实体集:实体集:某个实体型下的全部实体,称为实体集。属性属性(Property):实体所具有的每一个特性都称为一个属性。属性有“型”和“值”的概念,属性的名称就是属性的“型”;对型的具体赋值就是属性的“值”。学生的姓名、学号、年龄、性别、成绩是学生的属性学生的姓名、学号、年龄、性别、成绩是学生的属性库存号、说明、现有数量、在仓库中的位置等是库存的属性库存号、说明、现有数量、在仓库中的位置等是库存的属性第41页,共69页,编辑于2022年,星期日主
27、关键字主关键字:在众多属性中能够唯一标识实体的属性或属性组。例:学生实体中的学号,产品实体中的产品号,学生实体中的学号,产品实体中的产品号,订单实体中的订单号订单实体中的订单号辅助关键字:辅助关键字:不能唯一表示一个记录的字段。联系:联系:一个实体集内部各实体之间的相互联系,叫做实体内部联系。在实体集之间的联系,称为实体的外部联系。第42页,共69页,编辑于2022年,星期日联系的种类和方式联系的种类和方式l一对一(一对一(1:1)联系)联系在两个实体集中,一方的一个实体最多与另一方对应的一在两个实体集中,一方的一个实体最多与另一方对应的一个实体相联系。个实体相联系。如:已婚男性集合和已婚女性
28、集合如:已婚男性集合和已婚女性集合l一对多(一对多(1:m)联系)联系在两个实体集中,一方的一个实体与另一方对应的若干个实体在两个实体集中,一方的一个实体与另一方对应的若干个实体相联系;反之,另一方的一个实体最多对应一方的一个实体。相联系;反之,另一方的一个实体最多对应一方的一个实体。如:组织中的部门和职工,一个职工只属于一个部门,一个部门如:组织中的部门和职工,一个职工只属于一个部门,一个部门有多个职工有多个职工l多对多(多对多(m:n)联系)联系两个实体集中,任何一方的一个实体都对应另一方的若干个实两个实体集中,任何一方的一个实体都对应另一方的若干个实体。体。如:教学管理中的课程和学生,一
29、个学生可选多门课,如:教学管理中的课程和学生,一个学生可选多门课,一门课也可被多个学生选一门课也可被多个学生选第43页,共69页,编辑于2022年,星期日五、关系模型五、关系模型 由于系统中实体包括许多属性,而这些属性又会被由于系统中实体包括许多属性,而这些属性又会被不同的用户使用,所以将这些属性一起放在一个数据不同的用户使用,所以将这些属性一起放在一个数据表中显然是不合理的,需要进行分类与汇总,以编制表中显然是不合理的,需要进行分类与汇总,以编制不同的、且相关联的不同的、且相关联的表表,这就是所谓的,这就是所谓的关系关系。1、表具有以下四个性质:、表具有以下四个性质:l在表中的任意一列上,数
30、据项应属于同一个属性;l表中所有行都是不相同的,不允许有重复行出现;l行的顺序无关l列的顺序无关,但不能重复;第44页,共69页,编辑于2022年,星期日2、表具有以下四个特点:、表具有以下四个特点:l利用一系列的二维表存储信息。l在关系模型中,每个二维表都描述一种关系。l关系是表的数学术语l二维表也称作“关系表”l每一个表(关系)所保存的信息都与一个特定的实体有关。l二维表使描述信息间的关系十分便利,处理二维表所包含的信息也容易。第45页,共69页,编辑于2022年,星期日3、表的主要术语:、表的主要术语:l二维表中,一个竖列反映实体的某一属性,称之为字段。l表中的一行形成一个实体,称之为记
31、录(元组),由各个数据项(字段值)所组成,反映某一实体的所有有关特性。l关系模式:对关系的描述,用关系名(属性关系名(属性1,属性,属性2,属性,属性n)来表示。l对于关系模型来说,其数据模型就是一系列用二维表表示的关系。第46页,共69页,编辑于2022年,星期日4、关系模型的基本操作、关系模型的基本操作 关系模型有三种基本操作:投影、筛选和连接 l投影:从关系表格中选取指定的某些属性,以形成新的关系;l筛选:从关系表格中选取满足某种条件的记录,以建立新的关系;l连接:把两个关系中属性满足一定条件的记录接合在一起形成新的关系。第47页,共69页,编辑于2022年,星期日 1.数据需求分析:数
32、据需求分析:信息的转换信息的转换现实世界现实世界 信息世界(概念世界)信息世界(概念世界)计算机世界(数据世界)计算机世界(数据世界)客观事物类:客观事物类:事物相关性质集合事物相关性质集合现实世界现实世界人人认识选择描述认识选择描述实体实体集合实体实体集合 及及 实体实体联系相关属性集合联系相关属性集合ER模型模型信息世界信息世界加工、转换加工、转换存储存储 二进制数据集合二进制数据集合结构结构数文件数文件据记录据记录库相关数据项集合库相关数据项集合加工、转换加工、转换DBMS的的数据模型数据模型DBMS计算机世界(数据世界)计算机世界(数据世界)六、数据库的分析与设计六、数据库的分析与设计
33、第48页,共69页,编辑于2022年,星期日三个不同世界术语对照表三个不同世界术语对照表客观世界信息世界数据世界组织(事物及其联系)事物类(总体)事物(对象、个体)特征(性质)实体联系(概念模型)实体集实体属性数据库(数据模型)文件记录数据项对现实世界进行需求分析对现实世界进行需求分析具体做法:具体做法:了解组织机构情况,为分析信息流做准备;了解各部门业务情况,调查各部门输入和使用的数据及处理数据的方式与算法;确定数据库的信息组成及计算机系统应实现的功能第49页,共69页,编辑于2022年,星期日 概念结构设计:概念结构设计:在需求分析的基础上,从各个用户出发,进行实体、在需求分析的基础上,从
34、各个用户出发,进行实体、实体的属性和实体之间联系的分析,建立概念数据模型。实体的属性和实体之间联系的分析,建立概念数据模型。工具:实体联系图(E-R图)有实体、关系、属性三种图素,关有实体、关系、属性三种图素,关系有一对一、一对多、多对多。系有一对一、一对多、多对多。第50页,共69页,编辑于2022年,星期日实体联系图(实体联系图(E-R图)的设计方法图)的设计方法学生选修样本报表学生选修样本报表第51页,共69页,编辑于2022年,星期日确定实体和关键字:三个实体学生专业课程关键字学号专业号课程号第52页,共69页,编辑于2022年,星期日确定实体之间的联系-画实体联系图:.先画上矩形,填
35、上实体名;.画上椭圆形,填上属性名;.判断实体间是否有联系;.有联系画上菱形,再判断联 系是1还是M。矩形表示实体矩形表示实体椭圆形表示属性椭圆形表示属性菱形表示实体之间的联系菱形表示实体之间的联系直线表示连接直线表示连接1 1代表出现一次代表出现一次,M,M代表多次代表多次学号姓名专业名专业号课程名课程号学分成绩 N M 1 学生 课程 专业 选修 分配 M 第53页,共69页,编辑于2022年,星期日厂长厂长厂长号厂长号地点地点厂名厂名厂号厂号姓名姓名年龄年龄管理管理工厂工厂11厂长与工厂一对一联系数量数量仓库仓库仓库号仓库号价格价格品名品名货号货号地点地点面积面积存放存放产品产品1n仓库
36、与产品一对多联系成绩成绩学生学生学号学号学时数学时数课程名课程名课程号课程号姓名姓名性别性别学习学习课程课程mn学生与课程多对多联系助学金助学金第54页,共69页,编辑于2022年,星期日实际案例实际案例 建立局部建立局部E-RE-R图;图;综合局部综合局部E-RE-R图,产生总图,产生总E-RE-R图。图。例:假定某企业的信息系统,要求适应以下不同用户的应用要求:人事例:假定某企业的信息系统,要求适应以下不同用户的应用要求:人事科处理职工档案,供应科处理采购业务,生产科处理产品组装业务,科处理职工档案,供应科处理采购业务,生产科处理产品组装业务,总务科处理仓储业务。总务科处理仓储业务。企业各
37、部门局部E-R图:部门部门从属从属职工职工1n人事科职工职工领导领导1n职工职工承包承包产品产品1n供应商供应商供应供应产品产品mn供应科产品产品使用使用材料材料mn零部件零部件k第55页,共69页,编辑于2022年,星期日企业各部门局部E-R图:生产科零部件零部件装配装配mn产品产品仓库仓库mn总务科材料材料产品产品mn零部件零部件组装组装产品产品mn存放存放生产生产第56页,共69页,编辑于2022年,星期日 企业综合E-R图:装配装配mn组装组装仓库仓库mn存放存放mn保管保管mn部门部门从属从属职工职工1n领导领导1n承包承包产品产品1n供应商供应商供应供应mn消耗消耗材料材料nn零部
38、件零部件k参加参加mn合同合同n注:注:在综合中,同一实体只出现一次。在综合中,同一实体只出现一次。总体总体E-R图中未反映图中未反映“产品产品”与与“材料材料”之间的联系,即供应科视图中出现的之间的联系,即供应科视图中出现的“产品产品”与与“材料材料”之间的联系,在总体之间的联系,在总体E-R图中被除去了。因为这种联系是多余的,它图中被除去了。因为这种联系是多余的,它可从可从“零件零件”所所“消耗消耗”的的“材料材料”一种更为基本的联系中推导出来。一种更为基本的联系中推导出来。总体总体E-R图中图中“供应商供应商”与与“材料材料”之间被增加了新的联系之间被增加了新的联系“合同合同”,该联系并
39、未,该联系并未出现于任何局部出现于任何局部E-R图中,增加它是允许的,表示该信息系统能支持图中,增加它是允许的,表示该信息系统能支持“材料材料”合同处理。合同处理。第57页,共69页,编辑于2022年,星期日逻辑结构设计:逻辑结构设计:将概念数据模型转换为所选用的将概念数据模型转换为所选用的DBMSDBMS所支持的逻所支持的逻辑数据模型,然后进行数据的规范化处理。辑数据模型,然后进行数据的规范化处理。例:从E-R图导出关系数据模型E-RE-R图中每个实体,都相应转换为一个关系,并确定主关键字;图中每个实体,都相应转换为一个关系,并确定主关键字;对于对于E-RE-R图中联系,联系方式不同,处理方
40、法不同:图中联系,联系方式不同,处理方法不同:1:N联系:将“1”方的主键纳入“n”方实体对应的关系中,同时将联系的属性也一并纳入“n”方关系中。M(D):仓库(仓库号,地点,面积)产品(货号,品名,价格,仓库号,数量)第58页,共69页,编辑于2022年,星期日 M:N联系:对联系单独建立关系,用来联系双方。M(D):学生(学号,姓名,性别,助学金)课程(课程号,课程名,学时数)学习(学号,课程号,成绩)1:1联系:联系本身无属性,在任意方关系中加入对方主键均可。M(D):厂长(厂长号,厂号,姓名,年龄)工厂(厂号,厂名,地点)或:厂长(厂长号,姓名,年龄)工厂(厂号,厂长号,厂名,地点)物
41、理设计:是数据库在物理设备上的存储结构和存取方法的设计。物理设计:是数据库在物理设备上的存储结构和存取方法的设计。主要由数据库专业人员或主要由数据库专业人员或DBADBA根据根据DBMSDBMS所提供的技术支持进行设计。所提供的技术支持进行设计。第59页,共69页,编辑于2022年,星期日数据字典数据字典:是描述数据、处理、实体、存储等定义、格式、内容、联系的一个文件。是关于数据的数据库,它对系统内的各元素作出详细的定义和说明。在在IS IS建设过程中数据字典是必不可少的工具,它是工作的依建设过程中数据字典是必不可少的工具,它是工作的依据、统一的标准,它可确保数据的完整性和一致性。据、统一的标
42、准,它可确保数据的完整性和一致性。数据字典的作用:数据字典的作用:按各种要求提供列表按各种要求提供列表 据数据字典可把所有数据元素、数据结构、数据流、数据存储、外部实体、处理逻辑按一定的顺序全部列出以保证系统设计时不会遗漏。相互参照,便于系统修改相互参照,便于系统修改数据流图与数据字典可以相互参照、验证,以避免系统修改时的遗漏和不一致。第60页,共69页,编辑于2022年,星期日由描述内容检索名称由描述内容检索名称便于系统分析员的工作。一致性检验和完整性检验一致性检验和完整性检验可检验如下问题:是否存在没有指明来源或去向的数据流;是否存在没有指明数据存储或所属数据流的数据元素;处理逻辑与输入的
43、数据元素是否匹配;是否存在没有输入或输出的数据存储。人工方式人工方式数据字典的使用方式数据字典的使用方式计算机方式计算机方式把各类条目按一把各类条目按一定的格式写在卡定的格式写在卡片上或纸上,并片上或纸上,并分类建立一览表。分类建立一览表。在人工方式的基础上,将在人工方式的基础上,将内容整理存入计算机。内容整理存入计算机。第61页,共69页,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目数据元素条目数据元素条目总编号:总编号:1101编号:编号:101名称:学号有关编码说明:名称:学号有关编码说明:别名:别名:SNO 说明:本校学生编码说明:本校学生编码 编号编号数据值类型:连续
44、数据值类型:连续 班号班号类型:字符类型:字符 专业代码专业代码长度:长度:7 系代号系代号有关数据结构:学生成绩、学生卡入学年号有关数据结构:学生成绩、学生卡入学年号第62页,共69页,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目数据结构条目数据结构条目名称:学生登记卡总编号:名称:学生登记卡总编号:203说明:新生入学时填写的卡片编号:说明:新生入学时填写的卡片编号:008结构:学号有关的数据流、数据存储:结构:学号有关的数据流、数据存储:姓名新生登记表姓名新生登记表曾用名学籍表曾用名学籍表入学日期数量:约入学日期数量:约1000份份/年年出生日期出生日期第63页,共69页
45、,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目数据流条目数据流条目名称:期末成绩单总编号:名称:期末成绩单总编号:305说明:期末由任课教师填写编号:说明:期末由任课教师填写编号:005数据流来源:教师数据流来源:教师数据流去向:数据流去向:P2、P3包含的数据结构:包含的数据结构:科目名称流通量:科目名称流通量:200份份/学期学期任课教师任课教师第64页,共69页,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目数据存储条目数据存储条目名称:学习成绩一览表总编号:名称:学习成绩一览表总编号:402说明:按班汇集的各科成绩编号:说明:按班汇集的各科成绩编号:D5结
46、构:结构:班级信息量:班级信息量:150份份/学期学期学生成绩有关的数据流:学生成绩有关的数据流:P2D5学号学号D5P3姓名姓名成绩有无立即查询:有成绩有无立即查询:有第65页,共69页,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目处理功能条目处理功能条目名称:填写成绩单总编号:名称:填写成绩单总编号:5021说明:通知学生成绩编号:说明:通知学生成绩编号:P5输入:输入:D2P2输出:输出:P3学生学生处理:查处理:查D5,打印学生成绩单,打印学生成绩单第66页,共69页,编辑于2022年,星期日附:数据字典的条目附:数据字典的条目外部实体条目外部实体条目名称:学生总编号:名称:学生总编号:6001说明:编号:说明:编号:001输出数据流:输出数据流:输入数据流:输入数据流:P3学生学生个数:约个数:约4000个个第67页,共69页,编辑于2022年,星期日为保证数据的一致性,数据字典必须由为保证数据的一致性,数据字典必须由专人专人管理。管理。数据管理员的职责是维护和管理数据字典,保证它内容的完整一致。任何人员修改数据字典的内容,都必须通过数据管理员。数据管理员要把数据字典的最新版本及时通知有关人员。数据管理员数据管理员第68页,共69页,编辑于2022年,星期日谢谢大家,请进入下面章节的学习。第69页,共69页,编辑于2022年,星期日