数据结构(C语言版)严蔚敏清华大学出版社课件第十二章 ....ppt

上传人:hwp****526 文档编号:84391104 上传时间:2023-04-05 格式:PPT 页数:54 大小:386KB
返回 下载 相关 举报
数据结构(C语言版)严蔚敏清华大学出版社课件第十二章 ....ppt_第1页
第1页 / 共54页
数据结构(C语言版)严蔚敏清华大学出版社课件第十二章 ....ppt_第2页
第2页 / 共54页
点击查看更多>>
资源描述

《数据结构(C语言版)严蔚敏清华大学出版社课件第十二章 ....ppt》由会员分享,可在线阅读,更多相关《数据结构(C语言版)严蔚敏清华大学出版社课件第十二章 ....ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、4/2/20231 12.1 有关文件的基本概念有关文件的基本概念12.2 顺顺 序序 文文 件件12.3 索索 引引 文文 件件12.4 索索 引引 顺顺 序序 文文 件件12.5 直直 接接 存存 取取 文文 件件12.6 多多 关关 键键 字字 文文 件件4/2/20232一、文件一、文件即为记录的集合为记录的集合,和“查找 表”的差别在于,“文件”指的是存 储在外存储器中的记录的集合。记录是文件中可以存取的数据数据的 基本单位基本单位。12.1 有关文件的基本概念有关文件的基本概念4/2/20233二、文件二、文件可按其中记录的类型不同而 分成两类两类:其一为操作系统的文件,文件中的记

2、 录仅是一个字符组。由于操作系 统中的文件仅是一维的连续字符 序列,为了用户存取和加工的方 便,将文件中的信息划分为若干 组,其中每一组信息称作一个记 录;4/2/20234其二为数据库文件,文件中的记录带 有结构,是数据项的集合。记录 是文件中可以存取的数据基本单 位,数据项是文件中可以使用的 数据最小单位。数据最小单位。4/2/20235三、三、记录中能识别不同记录的数据项 被称为关键字关键字,若该数据项能唯 一识别一个记录,则称为主关键主关键 字字,若能识别多个记录则称为次次 关键字关键字。4/2/20236四、文件的逻辑结构四、文件的逻辑结构指的是呈现在用 户面前的文件中记录之间的逻辑

3、 关系;文件的物理结构文件的物理结构指的是文 件中的逻辑记录在存储器中的组 织方式。4/2/20237 1检索检索n顺顺序序存存取取:存取“当前记录的”下一个记录;n直接存取直接存取:存取第i个记录;n按按关关键键字字存存取取:存取其关键字等于给定值的记录。五、文件的操作:五、文件的操作:4/2/202382修改修改往文件中插入插入一个或一批记录;更新更新文件中某个记录的属性。从文件中删除删除一个或一批记录;4/2/20239文件的操作方式可以实时处理实时处理或批量处理。批量处理。3排序排序4/2/202310 本章讨论文件的几种常见的物理结构:顺序文件顺序文件索引文件索引文件索引顺序文件索引

4、顺序文件直接存取文件直接存取文件多关键字文件多关键字文件4/2/202311结结 构构 特特 点:点:记录在文件中的排列顺序是由记录进入存储介质的次序决定的,即文件物理结构中记录物理结构中记录的排列顺序排列顺序和文件的逻辑结构中记录逻辑结构中记录的排列顺序排列顺序一致。12.2 顺序文件顺序文件4/2/202312顺序文件的具体组织形式有两种:串联文件串联文件:物理记录之间的顺序由指 针相链。连续文件连续文件:次序相继的两个物理记录 其存储位置相邻;4/2/202313操作特点操作特点:1便于便于进行顺序存取;2不不便便于于进行直接存取,为取第i个记录,必须先读出前i-1个记录,对于磁盘上的等

5、长记录的连续文件可以进行折半查找;4/2/2023143插入新的记录只能只能加在文件的末尾;4删除记录时,只作标记只作标记;5更新记录必须生成新的文件生成新的文件。4/2/202315 顺序文件的插入、删除和更新操作在多数情况下都采用批处理方式批处理方式。此时,为处理方便,通常将顺序文件作成有序文件,称作“主文件”,同时将所有的操作作成一个“事务文件”(经过排序也成为有序文件),所谓“批处理”,就是将这两个文件“合”为一个新的主文件。具体操作相当于“归并两个有序表”。4/2/202316(1)对于事务文件中的每个操作 首先要判别其“合法性”(2)事务文件中可能存在多个操 作是对主文件中同一个记

6、录 进行的但有两点不同:但有两点不同:4/2/202317 假设主文件中含有n个记录,事务文件中含有m个记录,则对事务文件进行排序的时间复杂度为O(mlogm),内部归并的时间复杂度为O(m+n),则总的内部处理的时间为O(mlogm+n)。批处理的时间分析批处理的时间分析:4/2/202318 假设对外存进行一次读/取为s个记录,则整个批处理过程中读/写外存的次数为2(m/s+(m+n)/s)(其中s为对外存进行一次读/取的记录数)。4/2/2023191索引文件由“主文件”和多级“索引”组成;2索引中的每个记录由“关键字”和“指针”组成;3通常,索引文件中的主文件是无序文件,索引是(按关键

7、字有序)的有序文件;4“索引”是在输入数据建立文件时自动生成。初建时的“静态索引”为无序文件,经过排序后成为有序文件。一、结构特点:一、结构特点:12.3 12.3 索引文件索引文件4/2/202320二、操作的特点:二、操作的特点:检索方式为:直接存取和按关键字存取。“按关键字检索”将分两步进行:先查索引,然后根据索引中指针所指索取记录;插入记录时,“记录”插入在主文件的末尾,而相应的“索引项”必须插入在索引的合适位置上。因此,最好在建索引表时留有一定“空位”;4/2/202321删除记录时,仅需删除索引表中相应的索引项即可;更新记录时,应将更新后的记录插入在主文件的末尾,同时修改相应的索引

8、项。4/2/202322多级静态索引多级静态索引动态索引动态索引4/2/202323 主 文 件 索 引 表 查 找 表 第 二 查 找表 第三查找表.此时的索引文件结构:多级静态索引多级静态索引4/2/202324对主文件中每个记录每个记录建立一个索引项索引项:主关键字 记录在主文件中的存储位置称作稠密索引,由这些索引项构成索引表。4/2/202325从索引表建立的索引称查找表,其中每个索引项为:最大关键字 其所在数据块的存储位置称这类索引为非稠密索引。类似地,由查找表建立的索引为第二查找表;由第二查找表建立的索引为第三查找表。按关键字进行检索时,从第三查找表开始,至多访问外存五次。4/2/

9、202326索索引表采用查找树表或哈希表。优点优点:1)不需要建立多级索引;2)初建索引不需要进行排序;3)插入或删除记录时,修改索引方便。动态索引动态索引4/2/202327用查找树表作索引时,查找索引所需访问外存次数的最大值恰为查找树的深度。稠密索引的优点是,可以实现“预查找”缺点是,索引表占用的存储空间大。可以作索引的树表有:二叉排序树、B-树和键树。4/2/202328主文件按主关键字有序,对一组记录建立一个索引项(建立非稠密索引)。结构特点:结构特点:12.4 索引顺序文件索引顺序文件4/2/202329一、一、ISAM文件文件ISAM(Index Sequential Access

10、 Method)(索引顺序存取方法)是一种专为磁盘存取设计的文件组织方法。有两种典型的索引顺序文件:4/2/202330文件的组织方式文件的组织方式:主文件按柱面集中存放,同时建立 三级索引:磁道索引、柱面索引和 主索引。关键字 指针 关键字 指针 磁道索引结构磁道索引结构基本索引项基本索引项溢出索引项溢出索引项4/2/2023312101024主主索索引引 r(14)r(21)r(38)r(41)r(57)r(63)r(72)r(85)r(99)溢 出 区 磁 道 索 引 r(514)溢 出 区 磁道索引 r(1024)一一 个个 柱柱 面面 .柱柱面面索索引引992101024T0T1T2

11、T3T4T54/2/202332检索:检索:可有两种方式:按关键字存取 从主索引开始,到 柱面索引,到磁道索引,最后取 得记录,先后访问四次外存。顺序存取 依关键字最小至大顺序存取。操作的特点:操作的特点:4/2/202333插入插入:修改本磁道的索引项(包括基本索 引项和溢出索引项)。将该磁道上关键字最大的记录移出 到本柱面的溢出区中;将记录插入在某个磁道的合适位置上;4/2/202334删除删除:在被删记录当前存储位置上 作“删除标记”。4/2/202335文件重组文件重组 在经过多次的插入和删除操作之后,大量的记录进入文件的“溢出区”,而“基本存储区”中出现很多已被删去的记录空间,此时的

12、文件结构很不合理。因此,对ISAM文件,需要周期地进行重整。4/2/202336柱面索引的位置柱面索引的位置 ISAM文件占有多个柱面,其柱面索引本身占有一个柱面,为使“磁头”的平均移动距离最小,柱面索引应设在数据文件所占全部柱面的中间位置上。4/2/202337二、二、VSAM文件文件VSAM(Vistual Storage Access Method)文件是利用操作系统中提供的虚拟存储器的功能组织的文件,免除了用户为读/写记录时直接对外存进行的操作,对用户而言,文件只有控制区间和控制区域等逻辑存储单位。4/2/202338.索引集索引集B+树树 顺序集顺序集控制区域控制区间数据集数据集1

13、1文件的结构文件的结构4/2/202339 2.控制区间控制区间是用户进行一次存取的逻辑单位,可看成是一个逻辑磁道。但它的实际大小和物理磁道无关。VSAM文件初建时,每个控制区间内的记录数不足额定数,并且有的控制区间内的记录数为零。控制区域控制区域由若干控制区间和它们的索引项组成,可看成是一个逻辑柱面。4/2/202340顺序集顺序集本身是一个单链表,它包含文件的全部索引项,同时,顺序集中的每个结点即为B+树的叶子结点,索引集索引集中的结点即为B+树的非叶结点。4/2/202341文件的操作文件的操作n检索:检索:可进行顺序存取和按关键字存取;n插插入入:按关键字大小插入在某个适当的控制区间中

14、,当控制区间中的记录数超过文件规定的大小时,要“分裂”控制区间,必要时,还需要“分裂”控制区域;n删删除除:必须“真实地”删除记录,因此要在控制区间内“移动”记录。4/2/202342VSAM文件文件通常被作为大型索引顺序文件的标准组织方式。其缺点是缺点是:占有较多的存储空间,一般只 能保持约75%的存储空间利用 率。(因此,一般情况下,极少 产生需要分裂控制区域的情况)其优点是优点是:动态地分配和释放空间,不需 要重组文件;能较快地实现对 “后插入”的记录的检索;4/2/202343和前几节讨论的文件组织方法不同,直接存取文件的特点直接存取文件的特点是,由记录的关键字“直接直接”得到得到记录

15、在外存上的映象地址映象地址。类似于哈希表的构造方法,根据文件中关键字的特点设计一种“哈希函数”和“处理冲突的方法”将记录散列到外存储设备上,又称“散列文件”。12.5 直接存取文件直接存取文件4/2/202344哈希文件的结构哈希文件的结构 由于记录在外存上是成组存放的,因此允许多个记录映象到同一个地址上。在此,称外存储器中存放多个记录的“数据块”为“桶”。因此由哈希函数得到的映象地址为“桶地址”。4/2/202345例如:有一组关键字如下所列 589,063,269,505,764,182,166,330假设哈希函数为 key MOD 7,每个桶可以容纳3个记录(称桶的容量为3),则哈希文件

16、如下:基桶063 182589 505 764269166330溢出桶4/2/202346 在哈希文件中,“冲突冲突”和和“溢出溢出”是不同的概念是不同的概念。一般情况下,假设桶的大小为m,则允许哈希地址产生m-1次的冲突,当发生第m次冲突时,才需要进行“冲突处理”,对散列文件而言,通常采用链地址法出路冲突。为区别起见,称直接“散列”的数据块为“基桶基桶”,而因“溢出”存放的数据块为“溢出桶溢出桶”。4/2/202347文件的操作文件的操作n检索检索:只能进行按关键字的查找,不能进行顺序查找。检索时,先在基桶内进行查找,若不存在,则再到溢出桶中进行查找;n插入插入:当查找不成功时,将记录插入在

17、相应的基桶或溢出桶内;n删除删除:对被删记录作特殊标记。4/2/202348优点:优点:记录随机存放,不需要进行排 序;插入、删除方便,存取速 度快;节省存储空间,不需要 索引区。缺点:缺点:不能进行顺序存取;在经过多 次插入和删除操作之后,需进 行“重组文件”的操作。4/2/202349一、多关键字文件的特点一、多关键字文件的特点除需要对主关键字建立“主索引”外,尚需对各个次关键字建立“次索引”。次索引项:次索引项:次关键字次关键字(指向记录的)指针(指向记录的)指针12.6 多关键字文件多关键字文件4/2/202350二、次索引的组织方法二、次索引的组织方法1多重链表文件多重链表文件特点:

18、将所有具有相同次关键字具有相同次关键字的记录链接在同一链表中的记录链接在同一链表中,该链表的头指针即为次索引项中“指针域”的值;4/2/2023512倒排文件倒排文件特点:特点:将所有具有相同次关键字的具有相同次关键字的记录构成一个次索引顺序表记录构成一个次索引顺序表,此时的次索引顺序表中仅存放记录的“主关键字”或记录的“物理记录号”。次索引项中的“指针”指向相应的次索引顺序表;4/2/2023523次关键字索引表本身的结构次关键字索引表本身的结构 可以是顺序表顺序表,也可以是树表树表或哈哈希表希表,视具体的次关键字的特性而定。4/2/202353本章学习要求:本章学习要求:熟悉各类文件的特点,构造熟悉各类文件的特点,构造方法以及如何实现检索,插方法以及如何实现检索,插入和删除等操作。入和删除等操作。4/2/202354

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁