《2023年数据库基础知识.pdf》由会员分享,可在线阅读,更多相关《2023年数据库基础知识.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选 数据库基础知识 1信息系统:一个由人、计算机等组成的能进行信息的收集、传递、储存、加工、维护、分析、计划、控制、决策和使用的系统。(核心为数据库)2计算机数据管理 3 阶段:人工管理阶段、文件系统阶段、数据库系统阶段 3数据库系统的组成:数据:是信息的符号化,数据库系统的工作对象,数据库数据称为存储数据、工作数据或操作数据,数据库中的存储数据时集成的 共享的。数据元素:数据的基本单位 数据对象:性质相同的数据元素的集合,是数据的一个子集 3 类用户:终端用户联机用户、最终用户(从计算机联机终端存取数据库的人员);应用程序员系统开发员(负责设计和编制应用程序的人员);数据库管理员DBA 全
2、面负责数据库系统的管理维护和正常使用的人员。软件:数据库管理系统 DBMS Date Base Management System 硬件 4数据库管理系统:主要功能数据库定义、数据库存取、数据库运行管理、数据库建立和维护、数据通信 组成数据定义语言(DDL)、数据操纵语言(DML)、数据控制语言(DCL)、实用程序 5数据模型:(1)概念模型:是对客观事物及其联系的抽象,用于信息世界的建模,它强调其予以表达能力,以及能够较方便、直接地表达应用中各种语意知识,按用户的观点对数据和信息建模 主要概念实体、属性、关键字、域、实体型、实体集、联系、一对一联系、一对多联系、多对多联系 概念模型表示方法:
3、E-R图(实体联系法)。主要成分实体、联系、属性(2)数据模型:分为层次、关系、网状模型,之间的根本区别在于数据之间的联系方式不同。关系模型用二维表;层次模型用树结构;网状模型用图结构。层次与网状模型是早期的数据模型,称为格式化数据模型 6层次模型:最早使用的模型,一棵有向树。特征:有且仅有一个结点没有双亲,为根结点;其它结点有且仅有一个双亲 每个结点描述一个实体型,称为记录类型;一个记录类型可以有多个记录值,简称记录;画层次模型可用无向边代替有向边 7网状模型:两个或两个以上的结点都可以有多个双亲结点,有向树变成有向图 特征:可以有一个以上的结点没有双亲;至少有一个结点可以有多于一个双亲 8
4、关系模型:其数据结构是一个二维表框架组成的集合,每个二维表称为关系。基本操作:插入、删除、修改、查询 一、关系数据库 1基本术语:关系 元组:表中一行为一个元组,对应存储文件中的一个记录值 属性:表中的列称为属性,属性值相当于记录中的数据项或者字段值 域:属性的取值范围,即不同元组对同一个属性的值所限定的范围 关系模式:对关系的描述 精选 候选关键字:属性或属性组合,其值能够唯一的标识一个元组 关键字:能够唯一标识一个元组属性或属性的组合,不能去重复值 外关键字:如果一个关系中的属性或属性组并非该关系的关键字,但它是另外一个关系的关键字 全关键字:关系模型的所有属性组诗这个关系模型的候选关键字
5、,称为全关键字 2关系运算:选择(筛选):从关系中选出满足给定条件的记录的操作,从行的角度 投影:从一个关系中选出若干指定字段的值的操作,从列的角度 联接:把两个关系中的记录按一定的条件横向结合,生成一个新的关系(常用自然联接)二、数据库设计 1需求分析(最重要):收集资料、分析整理、数据流图、用户确认 2概念结构设计:目标是产生整体数据库概念结构,即概念模式。工具 E-R图 3逻辑结构设计 4物理结构设计 5数据库实施:建立数据库结构、数据载入、应用程序的编写和载入、数据库试运行 6数据库运行维护 三、ACCESS 的基本对象 由数据库对象和组两部分组成 对象分为:表、查询、窗体、报表、数据
6、访问页、宏、模块 第一章 数据结构与算法 一、算法:指解决某个问题的方法 1特性:有穷性、确定性、可行性、拥有足够的情报 2基本要素:1 数据对象的运算和操作算术运算、逻辑运算、关系运算、数据传输;2算法的控制结构算法中各操作之间的执行顺序,一个算法一般用顺序、选择、循环三种基本控制结构组成。3算法的复杂度 1 时间复杂度:执行算法所需要的计算工作量,用算法在执行过程中所需的基本运算次数来衡量 2 空间复杂度:执行这个算法所需要的内存空间。即算法程序所占空间、初始输入数据所占的存储空间、以及算法执行过程中所需的额外空间 二、数据结构:反映数据元素之间关系的数据集合的表示,即带有结构的数据之间的
7、前后件关系(相互有关联的数据元素的集合)三方面问题:1 数据的逻辑结构:从逻辑关系上描述数据,与数据在计算机中的存储位置无关 2 数据的存储结构:数据元素及其关系在计算机存储器内的表示。分为 4 种:顺序存储方式、链式存储方式、索引存储方式、散列式存储方式 3 数据运算:查找、读取、插入、删除、更新 三、线性结构与非线性结构(非空数据结构)1线性结构:有且仅有一个根结点;每一个结点最多有一个前件,也最多有一个后件。一个线性表中插入或删除任何一个结点后还是线性结构。精选 2线性表的链式存储结构称为线性链表(左指针指向前件结点,右指针指向后件结点称为双向链表)3带链的栈可以用来收集计算机存储空间中
8、所有空闲的存储点,称为可利用栈 4链式存储结构中,存储数据结构的存储空间可以不连续,个数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系式由指针域来确定的 四、栈 是限定仅在表尾进行插入和删除操作的线性表。表尾端为栈顶,栈顶元素总是最后被插入的元素,也是最先能被删除的元素。栈的修改原则:先进后出 后进先出 栈的顺序存储结构:Top=0 栈空 栈的基本运算:入栈(有上溢错误)、出栈、读栈顶元素(栈顶指针不变,栈顶指针为 0 说明栈空,读不到栈顶元素)、初始化、置空、判断栈是佛为空或满、提取栈顶元素等。五、队列 是限定仅在表的一端进行插入,而在表的另一端删除数据元素的线
9、性表。(先进先出)允许插入的一端队尾 基本运算:入队、退队 队列的顺序存储结构:循环队列,初始状态为空 六、查找 顺序查找:在线性表中查找指定的元素 二分法查找:只适用于顺序存储的有序表即要求线性表中的结点必须按照关键字值的递增或递减顺序排列 七、树 1一种简单的非线性结构,所有数据元素之间的关系具有明显的层次性,是 N 个结点的集合 2特点:每层平均的结点数为树的度,每一个结点的度最大为 2,当一个结点既没有左子树也没有右子树时该结点为叶子结点。非空二叉树只有一个根结点;每一个结点最多有两棵子树,且分别称为该结点的左子树和右子树 3第 K 层上最多有 2k-1(k1)个结点;深度为 m 的二
10、叉树最多有 2m-1个结点;任意一棵二叉树,度为 0 的结点(叶子结点)总是比度为 2 的结点多一个 具有 n 个结点的二叉树,其深度至少为log2n+1 4父节点:每个结点最多只有一个直接前驱(前件)根结点:没有直接前驱的结点只有一个为树根 子结点:每一个结点可以有多个后件 5满二叉树也是完全二叉树,而完全二叉树一般不是满二叉树 前序遍历:根结点、左子树、右子树 中序遍历:左子树、根结点、右子树 后序遍历:左子树、右子树、根结点 八、排序法 1冒泡排序法和快速排序法都属于交换类排序法 2冒泡排序法的平均执行时间为:n2 快速排序法平均执行时间为:nlog2n 精选 第二章 程序设计基础 一、
11、程序设计风格:(1)源程序文档化:标识符的命名、程序的注释序言性注释与功能性注释、程序的视觉组织(2)数据说明(3)语句输出(4)输入输出 二、结构化程序设计主要原则:自顶向下、逐步求精、模块化、严格控制 goto 语句 三、面向对象的基本概念:对象、类和属性 方法 继承 多态性 消息 1对象:对象的操作也称为方法或服务;属性即对象所包含的信息;操作描述了对象的功能。对象特性标识唯一性、分类性、封装性、模块独立性 2类与实例:类是具有共同属性、共同方法的对象的集合,它描述了属于该对象类型的所有对象的性质,一个对象则是其对应类的一个实例。3消息:是实例之间传递的信息 4同样的信息被不同对象接收时
12、可导致完全不同的行动 第三章 软件工程基础 一、软件工程 是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、实践标准和工序 13 个要素:方法、工具、过程 2基本原则:抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性、可验证性 3核心思想:把软件产品看做是一个过程产品来处理 4软件生命周期:软件产品从提出、实现、使用维护到停止使用退役的过程 包括:可行性研究与计划制定、需求分析、软件设计、软件实现、软件测试、运行和维护 软件设计结构设计(定义软件系统各部件之间的关系)、数据设计(将分析时查创建的模型转化为数据结构的定义)、接口设计(描述软件内部、软件和协作系统之间以及软件与人
13、之间如何通信)、过程设计(把系统结构部分转换为软件过程描述)5软件设计基本原理:抽象、模块化、信息隐蔽、模块独立性 在程序结构中,各模块的内聚性越强,则耦合性越弱。软件设计应该尽量做到高内聚、低耦合,有利于提高模块独立性。二、结构化分析方法:适用于分析大型的数据处理系统 1是一种建模技术,模型的核心是数据字典,3 种图:1 实体关系图 ERD,描述数据对象及数据对象之间的关系,用于数据建模;2 数据流图 DFD,用于功能建模;3 状态迁移图STD,用于行为建模 2三个主要目标:描述客户的需要、建立创建软件设计的基础、定义在软件完成后可以被确认的一组需求 三、数据流图 是描述信息流和数据从输入移
14、动到输出时背应用变换的图形化技术。是一种图形化的系统模型,表示信息系统的主要需求 实现信息抽象、实现信息隐藏 两种:变换型 事务型 基本元素:外部实体、数据流、过程、数据存储 四、数据字典 精选 是关于数据的信息的集合,对数据流图中各个元素做完整的定义与说明,是数据流图的补充工具;数据流图和数据字典共同构成系统的逻辑模型。包含:名称、别名何处/如何使用、内容描述、补充信息 五、软件需求规格说明书 引言、任务概述、数据描述、功能要求、性能需求、其他要求、其他要求、附录 六、结构化设计 采用最佳的可能方法设计系统的各个组成部分以及各成分之间的内部联系的技术 两步:1 概要设计(总体设计):将软件需
15、求转化为数据结构和软件的系统结构;2 详细结构(过程设计):通过对结构表示进行细化,得到软件详细的数据结构和算法 七、计算机辅助设计 CAD 计算机辅助过程 CAE 计算机辅助软件过程 CASE 八、1软件测试四个步骤:单元测试(静态分析或动态测试)、集成测试、验收测试、系统测试。软件测试是尽可能多的发现软件中的错误。贯穿整个软件生命周期 2开发阶段,软件调试,诊断和改正程序中的错误 第四章 数据库设计基础 1数据库:长期存储在计算机内的、有组织的、可共享的数据集合。数据库是由一个互相关联的数据的集合和一组用以访问这些数据的程序组成 数据库中存储的基本对象 2数据库管理系统功能 数据模式定义、
16、数据存取的物理构建、数据操纵、数据的完整性安全性定义与检查、数据库的并发控制与故障恢复、数据的服务 3数据库系统的基本特点 数据的集成性、数据的高共享性与低冗余性、数据的独立性、数据的统一管理与控制 4数据库系统的内部结构体系 1 三级模式:概念模式、外模式、内模式 内模式处于最底层,它反映了数据在计算机物理结构中的实际存储形式;概念模式处于中间层,它反映了设计者的数据全局逻辑要求;外模式处于最外层,它反映了用户对数据的要求 2 两级映射:概念模式到内模式的映射、外模式到概念模式的映射 5数据模型用来抽象、表示和处理现实世界中的数据和信息。两个阶段:把现实世界的客观抽象为概念模型;把概念模型抽
17、象为某一 DBMS 支持的数据模型 内容:数据结构、数据操作、数据约束 6E-R图的三个要素:实体、实体的属性、实体之间的联系 7数据的完整性:实体、参照、用户定义完整性 8概念模式:也也称逻辑模式,是对数据库系统中全局数据逻辑结构的描述,是全体用户公共数据视图,一个数据库只有一个概念模式 9外模式:也称子模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述数据库用户的数据视图。一个概念模式可以有若干个外模式 10内模式:又称物理模式给出了数据物理存储结构与物理存取方法 11数据库应用系统的 7 个部分:应用系统、应用开发工具软件、数据库管理系统、操作系统、硬件 精选 12数据库设
18、计方法:面向数据、面向过程 13数据库设计前四个阶段的成果:需求说明书、概念数据模型、逻辑数据模型、数据库内模式 1串的长度是指串中的字符个数,其字符个数可以为零 2对象的基本特点:标识唯一性分类性多态性封装性和模块独立性 3软件危机:泛指在计算机软件的开发和维护过程中所遇到的一系列严重问题(成本、质量、生产率等)4SQL 语句中创建用 CREATE,删除用 DROP,改变用 ALTER 5数据库系统(DBS)包括数据库(DB)和数据库管理系统(DBMS)6DBMS 是位于用户与操作系统之间的数据库管理系统,属于 OS 支持下的系统文件 7如果某条记录的某个字段尚未存储数据,则称该记录的这个字
19、段为空值。空值表示该值还没有确定。空值与空字符串的含义不同 8顺序表可以随机访问任意一个结点,而链表必须从第一个数据结点出发时,逐一查找每个结点 9如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用顺序查找;即使是有序线性表,如果采用链式存储结构,也只能用顺序查找 10顺序查找不成功时和给定关键字比较的次数为 n+1(较大);二分法查找不成功的关键字比较次数为log2n+1(较小)11问题处理方案的正确而完整的描述称为:算法 12树的结点数等于所有结点的度与对应的结点个数乘积之和加 1;叶子结点树等于树节点总数减去度不为 0 的结点数之和 13二分法查找的存储结构仅限于顺序存储结
20、构且是有序的 1420 世纪 70 年代提出了结构化程序设计 15类与对象的关系是抽象与具体 16继承是使用已有的类的定义作为基础建立新类定义技术。17集成测试时要进行接口测试、全局数据结构测试、边界条件测试、非法输入测试 18程序调试的任务:诊断和改正程序中的错误(开发阶段)19程序调试的基本步骤:错误定位、修改设计和代码以排除错误、进行回归测试防止引进新的错误 20软件设计是把一个软件需求转换为软件表示的过程。是确定系统的物理模型。基本目标是用比较抽象概括的方式确定目标系统如何完成预定任务。21模块化:是指把一个待开发的软件分解成若干简单的部分 22数据流图的 4 中符号:数据存储(双杠)
21、、数据原点(方框)和终点、数据流向(箭头)、数据加工(圆或者椭圆)23顺序存储结构:存储密度大、插入删除元素按操作不方便、逻辑上相邻的结点物理上必须相邻、可以通过计算机直接确定第一个节点的存储地址 24N 个单向链表需要至少 N+1 个指针单元 25对象:代表着正在创建的系统中的一个实体、对象之间的信息传递是通过消息进行的、对象是一个状态和操作的封装体 26内聚程度最弱的为:偶然性内聚 数据处理的中心:数据管理 VBA 中定义常量用:Const 精选 运行宏时按照:从上到下的顺序 预览主/子报表时,子报表页面页眉中的标签:不显示 SetWarning:关闭或打开系统消息的宏命令 注释分为:功能性、序言性 使用“自动创建”查 ungjiand 报表只包括:主体区 参数传递方法:按值、按址