《数据结构》知识点总结.pdf》由会员分享,可在线阅读,更多相关《数据结构》知识点总结.pdf(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据结构知识点总结数据结构知识点概括第一意概论数据就是指能够被if算机识别、存储和力ni:处理的信息的载体。数据元素是数据的基本单位,可以由若干个数据顷组成。数据项是具有独立含义的段小标以单位。数据结构的定义逻幸自结构:从i芝箱纺构上描述数据,独立于i-1-算机。线性给构一对一关系线性结构:多对多关系。存(i吕约构:是逻辑结构用计算机语言的实现顺序存储结构如数组链式存储结构如链衰。索号存储约构稠密索引:每个纺点都有索引项。稀疏笨引:每组结点都有索号写)j。古史纠存储结构虫日做列表数据运算对数据的告是作。定义在逻辑结构上,每种逻辑结构都有一个运算集合常用的有:检索、插入、删除、更新、排序。数据类
2、型是一个值的集合以及在这些值上1主义的一组操作的总称结构类型:由用户借助于捎述机制定义,是J导出类型。抽象数据类型ADT:是抽象数据的组织和及之的操作。相当于在概念层上描述问题。优点是将数据和操作封装在一起实现了信息隐藏。程序设计的实质是对实际问题选择一种好的数据结构,设ti个好的第法。算i索取决于数据结构。算法是一个良定义的计算过程,以一个或多个值输入,并以一个或多个值输出。评价算法的好坏的因素算法是正确的:执行第法的时间执行第法的存储空间(主要是辅助存储空间算法易于理解、编码、调试。时间复杂度:是某个算法的时间将货,宫是该算法所求解问题规悟ln的函数。渐近时间复杂度是指当问题规模趋向无穷大
3、时,该算法时间复杂度的数量级。评价一个算法的时间性能时,主要标准就是第法的湖近时间复杂$:.算法中ifi句的频度不仅及问题规模有关,还及输入实例中各元素的职值相关。时间复杂度校数量级递增排列依次;J,1:常数阶0(I)、对数阶0(Jog2n)、线性阶0(川、线性5N数阶0(nlog2n)、平方阶0(n2)、立方阶0(n3)、k次方阶0(nk)、指数阶0(2n)。空间复杂度是某个算法的空间税费,它是该算法所求解问题规模口的函数。第法的时间复杂度和空间复杂Jj合称算法复杂度。第二章线性表线性表是由n;,:o个数据元素组成的有限序列。11=0是空表:非空衰,只能有一个开始结点,有且只能有一个终瑞结点
4、线性表上定义的基本运算构边空袭:lnitlist(L)求表长:Listlength(L)取给点GetNode(L,i)查找:LocateNode(L,x)插入:lnsertList(L,x.i)删除:Delete(L,i)顺序表是按线性袤的追缆结构次序依次存放在一组地址连续的存储单元中。在存储单元中的各元素的物理位置I I 16 数据结构知识点总结平日i笠输给构中各纺点相守ll关系是一致的。地址计算LOCa(j)=LOCa(I)+(i-1)咱:(首地址为I)在顺序表中实现的基本运算插入平均移动结点次数:!1n/2:平均时间复杂度均为0(n).删除平均移动结点次数:!1(n-1)/2:平均时间复
5、杂度均为0(11).线性袤的链式存储结构中结点的逻辑次序和物理次ff不一定相同,为了rm正确表示给点间的逻辑关系,在存储每个给点值的同时,还存储了灭,后继结点的地址信息、(即指针或链。这两部分信息、组成链表中的纺点结构一个单链表白头指针的名字来命名单链表运草草:建立单链表头插法:s-next=head:head=s:生成的)ll!il序及输入顺序相反平均时间复杂度均为0(n).尾ffi法head=rear=null:if(head=null)head=s:else r-next=s:r=s:平均时间复杂度均为0(n):!Jn头结点的算法对开始结点的操作无需特殊处理,统一了空袭和非空袭。查找按序
6、号及查找位置有关,平均时间复杂度均为0(n).按值及输入实例有关,平均时间复杂j:均为0(n)。插入运算:p=GetNod巳(L,i-1),s-next=p-next,p-next氏平均时间复杂度均为0(n)删除运算:p=GetNode(L,i-1):r=p剖1ext:p-next=r-next:free(r):平均时间复杂度均为0(n)单循环链表是一种首尾相接的单链袭,终端结点的指针域指向开始结点或头结点。链表终.1I-:条件是以指针等于头指针或尾指针采用单循环链表在实用中多采用尾指针表示单循环链衰。优点是查找头指针和尾指针的时间都是0(I),不用i也历整个链表双链表就是双向链衰,就是在单链
7、袤的每个结点里再增加一个指向其直接前趋的指针域prior,形成两条不同方向的链。由头指针headf住一确定。双链表也可以头尾柑链接构成双向)循环链.双链表上的插入和删除时间复杂度均为0(I)。顺序表和链袤的比较 l基于空间:顺序袤的存储空间是静态分配,存储密度为I:适于线性表事先确定其大小时采用。链袤的存储空间是动态分配,存储密度!:适于线性表长度变化大时采用。基于时间:顺序表是随机存储结构,当线性袤的操作主要是查找时,直采用以插入和删除操作为主的线性表直采用链做存储纺构。若锚入和删除主要发生在表的前尾两端,贝。直采用尾Ht针表示的单循环链衰。第三掌拔和队列梭(Stack)是仅限制在袤的虫指进
8、行插入和删除运算的线性袭,称插入、删除这一直均为校顶,另一端称为战底。表中无元素时为空钱。梭的修改是按后进先出的原则进行的,我们又称拔为LIFO表(Last In First Out)。通常校有顺序校和链J战两种存储结构。梭的基本运算有六种向边空战:InitStack(S)户l校空StackEmpty(S)步lj校满StackFull(S)进校Push(S,x)返校Pop(S)取梭顶元素:StackTop(S)在顺序校中有“上溢”和“下溢”的现象。上端”是校顶指针指出梭的外而是阳错状态“下说”可以表示校为空钱,因此用来作为控制转移的条件。顺序战中的基本操作有六种:构造空梭纠l校空.引斗u党满进
9、校退战驭梭琐元素链钱则没有上溢的限制,因此迹:免不要乒IH会满。链钱不需要在头部附加头结点,只要有链袤的头指针就可以了链校中的基本操作有五种构造空投.!fl钱空避校.if!梭战顶元素2 I 16 数据结构知识点总结队纠1J(Queue)是一种运3享受限的线性衰,领入在袤的一端进行,而删除在袤的另一直指进行,允许删除的一揣称为队头(front),允许插入的一端称为队尾(rear)队列的操作原则是先选先出的,又称作FIFO表(FirstIn First Out)队列也有顺序存储和链式存储两种存的击。陶。队列的基本运算有六种:空队:InitQueue(Q)乒lj队空QueueEmpty(Q)归l队满
10、QueueFull(Q)入队:EnQueue(Q,x)出队:DeQueue(Q)取队头元素:QueueFront(Q)顺序队列的“假上游”现象:由于头尾指针不断前移,超出向最空间。这时整个向最空间及队列是空的却产生了“上说”现象为了克服“假上汹”现象引入循环向量的概念,是把向最空间形成一个头尾相接的环形,这时队如l称循环队列判定循环队lj是空还是满,方法有三种一种是另设一个布尔变量来判断;第二种是少用一个元素空间,入队时先测试((rear+I)%m=front)?满:空:第三种就是用一个计数器记录队列中的元素的总数。队列的链式存情结构称为链队列,一个链队列就是一个操作受限的单链袭。为了便于在表
11、尾边行插入入队的操作,呈I:表尾t的日一个尾指针,一个链队列就由一个头指针和一个尾指针唯一地确定。链队:y1J不存在队满和上泌的问题。在链队列的出队第法中,要注意当原队中只有一个结点时,出队后要同进修改头尾指针并使队:y1J变空第四掌串串是零个或多个字符组成的有吸序f1J。空串是指长度;-J,1军的串,也就是串中不包含任何字符约点空白串指串中包含一个或多个空格字符的息。在一个串中任意个连续字符组成的子序列称为该串的子串,包含子串的串就称为主息子串it.i:串中的ff号就是指子串征主串中首次出现的位置。空串是任意串的子E扭,任意串是自身的子$。串分为两手中串常量在程序中只能引用不能改变 巨扭变量
12、的值可以改变。串的基本运算有:求串长strlen(char*s)串复制strcpy(charto,char*fro1n)串联接st比at(char针。,char*from)$比较charcmp(char*s I,char*s2)字符定位strchr(char咔,charc)串是特殊的线性表(结点是字符,所以串的存储结构及线性袤的存储结构炎似。串的顺序存储纺灼简称为顺序卑。顺序串又可按存储分配的不同分为静态存储分配直接用定长的字符数组来定义。优点是涉及串长的缺作速度快,但不适合插入、链接操作动态存储分配是在定义串时不分配存储空间,需要使用时按所需串的长度分配存储单元。串的链式存储就是用单链表的方
13、式存储串值,串的这种怪式存储结构简称为链净。链串及单链袤的差异只是它的结点数据i续为单个字符。为了解诀“存(it;密度p低的状况,可以让一个纺点存储多个字符.RP结点的大小。顺序阜上子串位的运算:又称串的“模式匹配”或“串匹配气是在主$中查找出子$出现的位置在串匹配中,将主息称为目标(串,子串称为模式(串。这是比较容易理解的,E扭匹配问题就是找出给定模式串P在给定目标$T中首次出现的有效位移或者是全部有效位移。最坏的情况下时间复杂度是0(n-m+I)1的,假如111及3 I 16 数据结构知识点总结口同阶的话贝。它是0(n2)。链串上的子串定位运算立移是给点地址而不是整数第五章多维数组数组一般
14、用顺序存储的方式表示存ii者的方式有:行优先顺序,也就是把数组遂行依次排列,PASCAL、C f1J优先顺序,就是把数组逐功l依次排列,FORTRAN 地址的计算方法:按行优先顺序排列的数组:1Ca(ij)=LOCa(II)+(i-1)*n+(j-1)*d.按列优先顺序排列的数组:LOCa(沪LOCa(ti)+(j-1)*n+(i-1叮矩阵的压缩存储为多个相同的非零元素分配一个存储空间:对零元素不分自己空间。特殊矩阵的概念:所谓特殊矩阵是指非零元素或零元素分布有一定规律的矩阵。稀疏矩阵的概念:一个矩阵中若;lt非零元素的个数远远小于零元素的个数,贝IJi亥矩阵称为稀疏矩阵。特殊矩阵的类型对称矩
15、阵:满足a(ij)=a(ji)。元素总数n(n+I)/2.l=max(i,j),J=n1in(i,j),LOCa(ij)=LOC(saOJ)+(I*(I+I)/2+J)*d.三角矩阵:上三角阵k=i*(2n-i+I)/2+j-i,LOCa(ij)=LOC(saO)+k叮下三角阵:k=i*(i+I)/2竹,LOCa(ij)=1C(saOJ)+k*d.对角矩阵:k=2i竹,LOCa(ij)=LOC(saOJ)+k叮稀疏矩阵的压缩存南方式用三元组表把非零元素的值和它所在的行号f1J号做为一个结点存放在一起,用这些给点组成的一个线性表声是表示。但这种压缩存储方式将失去随机存储功能。加入行表记录每行的非
16、零元素在三元组司是中的起始位置,lW手持行袤的三元组表第六章树树是n个约点的有模集合,非空时必须满足只有一个称为恨的结点其余给点形成Ill个不相交的子簇,二称恨的子树。根是开始给点结点的子树数称度:151.为0的结点称叶子终端纺点头皮不为0的结点称分支结点非终端结点头除根外的分支结点称内部结点:的有j字树是子树有左,右之分的树:无序树是子树没有左,右之分的树:森材、是m个互不相交的树的集合:树的四种不同表示方法树形表示法:嵌王军集合表示法:四入表示法广义表表示法。二叉树的定义是n;:,o个结点的有良.它是空(n=O)或由一个根结点及两银互不相交的分别称作这个根左子树和右子树的二叉树组成。二叉树
17、不是树的特殊情形,及度数为2的有序树不同。二叉树的4个重要性质二叉树上第i层上的结点数目最多为2(i-1)(i;:,1)。:深度为k的二叉树至多有(2k)-I个结点(kI):在任意一根二叉树中,若终梢给点的个数为no,度为2的纺点数为n2,则n0=n2+1:具有11个结点的完全二叉树的深度为int(Iog2n)+I.满二叉树是一根深度为k,结点数为(2k)-I的二叉树完全二叉树是满二叉树在最下层自右向左去处部分给点:二叉树的顺序存储结构就是把二叉树的所有结点钱层次顺序存储到连续的存储单元中。存储前先将其画成完全二叉树)树的存储结构多用的是链式存俏。BinTNode的结构为Ichi Idldat
18、alrchi Id,把所有BinTNode类型的纺点,加上一个指向根结点的BinTree型头指针就构成了二叉树的链式存储结构,称为二叉链衰。它就是由根指针root唯一确定的。共有2n个指针咳,n+I个空指针。根据访问结点的次序不同可得三种泡历先ffi也历(前序i也历或先根泡历,中ffi也历(或中根泡历、后ff姐ill历(或后根泡历时间复杂度为0(n).利用二叉链表中的n+I个空指针城来存放指向某种泌历次序下的前趋结点和后继给点的指针,这些附加的指针就称4 I 16 数据结构知识点总结为“线索”,加上线索的二叉链表就称为线索链衰。线索彼得查找中序前趋和中序后继变得简单有效,但对于查找指定给点的前
19、序前趋和后序后继并没有什么作用树和森林及二叉树的转换是唯一5N.的。转换方法树变二叉树兄弟相连,保留长子的连线二叉树变树:结点的右孩子及其双亲连。森林变二叉树:J变二叉树,各个树的根相连。树的存储结构:有双亲链表表示法结点dataI parent,对于求指定结点的双亲或祖先十分方便,但不适于求指定结点的孩子及后代。孩子链表表示法为树中每个给点dataI next设置一个孩子链表firstchild,并将dataI firstchild存放在一个向量中双亲孩子她表表示法:将双亲链表手OJ哀号子链表结合。孩子兄弟链表表示法:结点结构le食mostchildldata I rightsibing,附
20、加两个分别指向该结点的最左孩子和右舍fl兄弟的指针域。树的前J字池历及相对应的二叉树的前j字泌历一致:树的后序地i历及相对院的二叉树的中序地i历一致。树的带权径长度是树中所有叶结点的手持权路径长度之利。树的辛苦权路径长度最小的二叉树就称为最优二叉树(RPI晗失受树)。在叶子的权值相同的二叉树中,完全二叉树的fill径长度最短。n吉夫曼树有11个时给点,共有2n-l个结点,没有度为1的结点,这类树又称为严格二叉树。变长编码技术可以便频度高的字符编码短,而狈l变低的字符编码长,但是变长编码可能使解码产生二义性。如00、01、0001这三个阴无法在解码时确定是哪一个,所以要求在字符编码时任一字符的编
21、码都不是其他字符编码的前缀,这种码称为前缀码(J王实是非前缀码)。n古犬曼树的应用最广泛地是在编码技术上,它能够容易地求出给定字符集及其概率分布的最优前缀码。哈失曼编码的构造很容易,只要画好了I晓夫曼树,按分支情况在左跻径上写代码0,右臣1f盖上写代码l,然后从上3l!J下到H十结点的相应路径上的代码的ff:Y-1就是该结点的段优前缀码。第七意图民的逆精结。向特征就是其结点(l页点的前趋和后继的个数都是没有限制的,即任意两个结点之间之间都可能相关。民IGraphG=(V,E).V是顶点的有穷非空集会,E是顶点岗对的有穷集有向阁Digraph:每条边有方向,无向阁Undigraph:每条边没有方
22、向有句完全阎:具有俨(n-1)条边的有向剧;无向完全怪:具有n(n-1)/2条边的无向民:有根阁有一个顶点有路径到达其它顶点的有向剧:简单路径是经过顶点不同的路径简单回路是开始和终端茧的简单路径:网络:是带权的阁。民的存储结构:邻按矩阵表示法用一个n阶方阵来表示阁的结构是唯一的,适合稠密剧。无向良l邻接矩阵是对称的。有向剧行是出度,列是入度建立邻接矩阵算法的时间是0(n+n2+e),其时间复杂度为0(n2)专ll按表表示法用顶点、袭和邻按司提胸成不是唯一的,适合稀疏刨顶点表结构vertexI firstedge,指针i续存放邻按表头指针。需fj按表用头指针确定。元向剧i析:边司是:有向怯l又分
23、出i在表和逆邻接表:邻按表结点纺构界Jadjvex I next,时间复杂度为0(n+e)。,空间复杂度为0(n+e)。5 I 16 数据结构知识点总结阁的:iii!历:深度优先i也历借助于邻接矩阵的列。使用投保存己访问结点广度优先地历借助于专ll接矩阵的行。使用队要1阳、存己访问给点。生成树的定义若从剧的某个顶点出发,可以系统地访问歪lj闺中所有顶点,则池历时经过的地和刻的所有Jij点构成的子隧称作该院的生成树。1&小生成树阁的生成树不唯一,从不同的顶点出发可得到不饲的生成树,把权值最小的生成树称为最小生成和J(MST)。构造最小生成树的算法 Prim 算法的时间复杂度为0(n2)及边数无关
24、适于稠密阂。Kruskal算法的时间复杂度为0(岖的,主要取泱于边数,较适合于稀疏阁。最短路径的第法:Dijkstra算法,时间复杂度为0(n2).类似于prim算法。拓扑排序:是将有向无环民IG中所有顶点排成一个线性序列,若U,VEE(G),则在线性序列ll在v之前,这种线性序列称为拓扑序列。拓扑排序也有两种方法:元前趋的1页点优先,每次输出一个无前趋的结点并删去此结点及其出边,最后得到的序列E!Pj宿扑序列。无后继的结店、优先:每次输出一个无后继的结点并删去此结点及其入边,最后得到的序列是逆拓扑序列。第八章排序记录中可用某一项来标识一个记录,贝。称为关键字项,i主数据项的值称为关键字。排序
25、是使文件中的记录按关键字i羞增(或i羞减)次序排列起来。基本操作:比较关键字大小改变指向记录的指针或移动记录。存储结构:顺序结构、链表结构、索引结构。经过排序后这些具有相同关键字的记录之间的相对次序保持不变,!ijlj称这种排序方法是稳定的,否则排ff算法是不稳定的。排序过程中不涉及数据的肉、夕、存交换则称之为“内部徘序”(内排序,反之,着存在数燎的内外存交换,贝。称之为外徘序。内部排序方法可分五类:插入仲序、选择排序、交换排序、归并排序和分配排序。评价排序算法好坏的标准主要有两条:执行时间和所需的辅助空间另外算法的复杂程序也是要考虑的一个因素。插入排序:直接插入排序:逐个向前插入到合适位置哨
26、兵监视哨)有两个作用作为11备交量存放Ri是在查找循环中用来监视下标变量j是否越界直接插入体序是就地的稳定排序。时间复杂度为0(n2),比较次数为(n+2)(n-1)/2:移动次数为“4)(n-J)/2;希尔排序:等问箱的数据比较并f主要求顺序排列,最后间隔为l希尔排序是就地的不稳定排序时间复杂度为0(n 1.2日,比较次数为(n 1.25):移动次数为(J.6111.2日:交换徘j字:冒泡徘If:.自下向上确定最轻的一个自上向下确定最重的一个自下向上确定最轻的一个,后自上向下确定最重的一个。冒泡排序是就地的稳定排序。时间复杂j变为0(n2),比较次数为II(n-J)/2;,移动次数为3n(n
27、-1)12,快速排序以第一个元素为参考基准,设定、动两个指针,发生交换后指针交换位置,直到指针重合。重复直到排序完成。快速排ff是非就地的不稳定徘j字时间复杂度为0(nlog2n),比较次数为n(n-1)/2,选择排序:直接选拷排j字:选挥最小的放在比较区前。直接j在择排j字就地的不稳定排序。时间复杂度为0(n约。比较次数为II(n-J)/2:堆排ff.建雄按层次将数据填入完全二叉树,从int(n/2)处向前逐个调整位置。然后将树根及最后一个叶子交换值并断开及树的连接并重建雄,直到l全断开。:J,佳排序是Jiiit地不稳定的排序,时间复杂j变为0(nlog2n),不适宜于记录数较少的文件归并排
28、J字:先两个一组排序,形成(n+l)/2组,再将两组井一组,直到剩下一组为止。6 I 16 数据结构知识点总结归并排F于是非就地稳定排序,时间复杂度是0(nlog2川,分配排序:箱排序按关键字的取值范罔确定箱子数核关键字投入箱子,链按所有非空箱箱排序的平均时间复杂度是线性的0(n).基数排序:从低位jlj高位依次对关键字进行箱排序。基数排序是非就稳定的排序,时间复杂度是0(d*n+d*rd)。各种排序方法的比较平!li在探:待排序的记录数目11;11较大的要用时间复杂度为0(nlog211)的排序方法:记录的大小(规模:记录大最好用链表作为存储结构,而快速排序和堆排序在链表上难于实现:关键字的
29、结构及其初始状态:对稳定性的要求:语言工具的条件:存储结构:时间和辅助空间复杂度。第九章查找查拢的同时对表做修改操作(如插入或删除贝1.ffl!萃的我称之为动态查找袋,否则称之为静态查找袋。衡量查找算法效率优劣的标准是在查找过程中对关键字需要执行的平均比较次数(郎平均查找长度ASL)。线性表查找的方法:顺序查找:逐个查找,ASL=(11+1)/2,二分查找:取中点i11t(n/2)比较,若小就比左区间,大就比右区间。用二叉11J;:t树表示。ASL=(艺每层给点数层数IN.分块查找。要求“分块有序”,将表分成若干;块内部不一定有序,并抽取各块中的最大关键字及其位置建立有序索引袭。二叉徘j字树(
30、BST)定义是二叉排序树是空和I或者满足如下性质的二叉树:着它的左子树非空,归lj左子树上所苟结点的值均小子根结点的值:若它的右子树非空,贝。右子树上所有结点的值均大于领结点的值左、右子树本身又是一拟二叉排序和I。二叉排序树的插入、建立、删除的第法平均时间性能是0(nlog211).二叉排序树的删除操作可分三种情况i进行处理:*P是叶子,则直接删除P,即将P的双亲pare11t中指向守的指针域置空即可。*P只有一个孩子气hild,此时只需将child和斗的双亲直接连接就可删去p.*p有两个孩子,则先1伊p给点的中序后继结点的数据到币,删除中序后继给点。关于B树多跻平衡查找树)。芭适合在磁鱼等直
31、接存取设备上组织i;IJ态的查找衰,是一种外资找算法。建立的方式是从下向上拱起。散:y1J技术将结点:按其关键字的做歹lj地址存储到敝:y1J袤的过程称为做列。做歹lj函数的选手幸有两条标准简单和均匀。常见的做31J函数构的选方法平方取中法:hash=i11t(x2)o/o I 00)除余法表长为m,hash=x%m 目乘取整法:hash=i11t(m(x呗i11t(X呗:A=0.618随机数法:hash=ra11dom(川。处理冲突的方法开放定址法:一般形式为hi=(h(key)刊i)%111 1i白n-1,开放定址法要求做列袤的装填因子。罢王I.开放定址法炎型线性探查法,addresS=(
32、hash(x)+i)%111,二次探查法:address=(hash(x)+i2)%m,双重散:y1Ji去:address=(hash(x)+i*hash(yo/om,.t主链法是将所有关键字为同义词的结点链按在同一个单链表中。.t主链法的优点!主链法处理冲突简单,且无堆积现象:链司是上的结点空间是动态申请的适于无法确定表长的情况:!主链法中可以大于l,结点较大时臭,指针峡两忽略,因此节省空间:!主链法构造的做:y1J君主删除结点易实现。拉链法也有缺点当给点规模较小时,用技链法中的指针域也要占用额外空间,还是开放运址法省空间。7 I 16 数据结构知识点总结第十章排序I 0.I 排序的基本概念
33、10.2插入徘序10.3:iz;择排序10.4交换排序本草草主要知识点徘序的基本概念和衡量排ff算法优劣的标准,其中衡量标准有算法的时间复杂皮、空间复杂度和稳定性直接插入忡序,希尔排序直接选择排序,堆排序冒泡排序,快速排序I 0.I排序的基本概念I.徘j字是对数据元素序列建立某种有序排列的过程2.徘序的目的:便于查找。3.关键字是安排序的数据元素集会中的一个域,排序是以关键字为基准进行的。关键字分主关键字和次关键字两种。对安排序的数据元素集合来说,如果关键字满足数据元素债不同时该关键字的值也一定不同,这俘的关键字称为主关键字不满足主关键字ii义的关键字称为次关键字。4.排序的种类:分为内部排序
34、和外部排芹,两大笑。若待排ff记录都在内存中,称为内部排ff,若待排序记录一部分在内存,一部分在外存,则称为外部排ff.注:外部排序时,要将数据分批调入内移到毛排序,中间结果还要及时放入外存,!ik然外部排序要复杂得多。5.排序算法好坏的衡量标准(I)时间复杂度一一它主要是分析记录关键字的比较次数和记录的移动次数。(2)空间复杂度一一算法中使用的内存辅助空间的多少。(3)稳定性一一若两个记录A和B的关键字值相等,旦排序后A、B的先后次序保持不变,则称这种排序算法是稳定的。10.2插入排序插入排序的基本思想是:每步将一个待排序的对象,t主艾关键字大小,插入到前而已经排好序的一组对象的适当位置上,
35、直到对象全部插入为止。简言之,边插入边排序,保证子序列中随时都是排好序的。常用的插入排序有直接插入排序和希尔排序两种。10.2.1直接插入排ff1、其基本思想是顺序地把待排序的数据元素按其关键字值的大小插入到已徘序数据元素子集合的适当位置。jyj l:关键字序列T=(13,6,3,31,9.27,5,II),请写出直接插入排序的中间过程序列。初始关键字序列【13),6,3,31,9,27,5,I I 第一次排序:“,13),3,31,9,27,5,II 第二次排序:口,6,13),31,9,27,5,II 第三次排ff,口,6,13,31),9,27,5,II 第四次排ff:口,6,9,13,
36、31),27,5,11 第五次排序:口,6,9,13,27,31,5,11 第六次排序:口,5,6,9,13,27,31 J,11 第七次排序:3,5,6,9,11.13,27,31)注:方括号J中为己排序记录的关键字,下ill辍线的关键字表示它对应的记录后移一个位置。2.直接插入排序算法8 I 16 数据结构知识点总结public static void insertSort(intJ a)mt i,J,temp;int n=a.Length;for(i=O;i -I&temp aj)(aj+I=aj;aj+I=temp;初始关键字序列:(13),6,3,31,9,27,5,11 第一次排序
37、:6,13),3,31,9,27,5,II 第二次排序:口,6,13),31,9,27,5,II 3、直接插入排序算法分析(I)时间效率:当数据有序时,执行效率最好,此时的时间复杂度为O(n):当数据基本反序时,执行效率最差,此时的时间复杂度为0(口2)。所以当数据越接近有序,直接插入排序算法的性能越好。(2)空间效率:仅占用l个缓冲单元一-0(I)(3)算法的稳定性稳定8.2.2希尔(shell)排序(又称缩小均量体序)1、基本思想把整个待排序的数据元素分成若干个小组,对同一小组内的数据元素用直接插入法徘序:小组的个数逐次缩小,当完成了所有数据元素都在一个组内的排序后排序过程结束。2、技巧:
38、小组的构成不是简单地“逐段分割”,而是将相隔某个增最d的记录组成一个小组,让增量d这趟缩短(例如依次取5,3,1),直到d=I为止。3、优点让关键字值小的元素能很快前移,且序歹lj若基本有序时,再用直接插入排序处理,时间效率会高很多。jyj 2:r量待排序的序列中有12个记录,它们的关键字序列T=(65,34,25,87,12,38,56.46,14,77,92,23),请写出希尔徘序的具体实现过程public static void shelJSort(intJ a,int d,int numOfD)(int i,j,k,111,span;int temp;int n=a.Length;fo
39、r(m=O;m numOfD;m+)fl共nmnOfD次循环span=dm;H取本次的增最值for(k=O;k span;k+)(共span个小组for(i=k;i -I&temp aj)aj+span=aj;j=j-span:ajspan=temp;9 I 16 数据结构知识点总结算法分析开始时d的值较大,子f3il中的对象较少,排序速度较快:随着排序进展,d值逐渐变小,子序列中对象个数逐渐变多,由于前而工作的基础,大多数记录已基本有j芋,所以排序速度仍然很快时间效率:O(n(Jog2n)2)空间效率:0(I)一一因为仅占用1个缓)p单元算法的稳定性:不稳定练习:I.欲将序列(Q,H,C,Y
40、,P,A,M,S,R,D,F,X)中的关键码按字母刑序重排,则初始d为4的希尔排序一趟的结果是?答:原始序列Q,H,C,Y,P,A,NI,S,R,D,F,X shell一趟后:P,A,C,S,Q,D卫X几HJ,1,Y2以关键字序列(256,301,751.129.937,863.742.694,076,438)为例,写出执行希尔排序(取d=5,3,l)算法的各趟排序结束时,关键字序列的状态解:原始F抑1:256.301,751,129,937,863.742,694,076.438 希尔排序第一趟d=5256 301 694 076 438 863 742 751 129 937 第二趟d=3
41、076 301 129 256 438 694 742 751 863 937 第三趟d=l076 129 256 301 438 694 742 751 863 937 10.3 i在择排序选桦树)字的基本思想是每次从待排序的数据元素集合中选取关键字最小(r!X.段大的数据元素放到数据元素集合的最前(或最后,数据元素集合不断缩小,当数据元索然合fl空时边择徘序纺束。常用的择排序算法:(1)直接地择排j字(2)堆排序10.3.1直接选手牵排序1、其基本思想每经过一趟比较斗引t找出一个段小值,及待排序列寂前丽的位置互换即可。RP从待仲序的数据元素集合中选IIR关键字最小的数据元素并将它及原始数据
42、元素集合中的第一个数据元素交换位置:然后从不包括第一个位置的数据元素集会中选取关键字最小的数据元素并将它及原始数据集合中的第二个数据元素交换位置:如此重复,直到数据元素集合中只剩一个数据元素为止。2、优缺点优点:实现简单缺点:每趟只能确定一个元素,表长fln时需要n-1趟jyj 3:关键字序列T=(21,25,49,25*.16,08),请给出直接选摔排序的具体实现过程。原始序列21.,25,49,25*.16,08 第l趟08.25,49.2沪,16.21 第2趟08.16,49,25*.25,21 第3趟08,16,21,25飞25.49 3在 4趟08.16,21,25*.25,49 3
43、在5趟08.16,21,25*.25,49 public static void selectSort(intJ a)int i,j,small;int temp;int n=a.L巳ngth;for(i=O;i n-1;i叫small=i H设第i个数据元素最小10 I 16 数据结构知识点总结for(j=i+I;j n;j+)H寻找最小的数据元素if(aUJ asmall)small=j;H记佼最小元素的下标if(small!=i)当最小元素的下标不为i时交换位置temp=ai;ai=asmall);asmall=temp;3、算法分析时间效率O(n2一一虽移动次数较少,但比较次数仍多。空
44、间效率:0(I)一一没有附加单元(仅用到l个temp)算法的稳定性:不稳定4、稳定的直接边择排序算法jyj:关键字序列T=(21,25,49,25飞16,08),请给出稳定的直接j在择排序的具体实现过程。原始序列21.,25,49.,25飞16,08;在l趟。8,21,25,49,25气163在 2趟。8,16,21,25,49,25*第3趟。8,16,21,25,49,25*第4趟。8,16,21,25,49,25*第5趟。8,16,21,25,25*,49 public static void selectSort2(int a)int i,j,small;int temp;int n=a
45、.Length;for(i=O;i n-1;i+)small=i for(j=i+l;j n;j+)(H寻找最小的数据元素if(aUJ i;j一)aUJ=aj-1;H把i亥区段尚未排序元素依次后移ai)=temp;H插入找出的最小元素8.3.2堆排序1什么是难?2怎样l雄?3怎样堆排ft?堆的定义设有11个数据元素的序列kO,kl,.,kn-I,当且仅当i满足下述关系之一时,称之为堆。解释:如果让满足以上条件的元素序列l(k O,k 1,.,kn-1)贩次排成一根完全二叉树,则此树的特点是树中所有给点的假均大于(或小子其左右孩子,此树的根结点llP堆顶必最大(:tilt最小。jyj 4:有序列
46、Tl=(08,25,”,46,58,67)和序列T2=(例,85,76,66,58,67,55)汕l断芭们是否“雄”?2.怎样建堆?步骤:从第一个非终端给点开始往前逐步调整,让每个双亲大于(或小于子女,直到j恨结点为止。11 I 16 数据结构知识点总结终端给点RP叶子没有任何子女,无需单独调整例:关键字序列T=(21.25,49,25飞16.08),ii最大堆。解:为便于理解,先将原始序列面i成完全二叉树的形式这样可以很消晰地从(n-1-1)/2开始调整。public static void createHeap(intJ a,int n,int h)(int i,j,flag;int te
47、mp;j=2*i+l;temp=ai;flag=O;II j为i结点的左孩子结点的下标while(j n&flag!=I)(H寻找左右孩子结点中的较大者J为其下标if(j n-I&aUJ=aj)/ai=aLiJ flag=I;II标记结束筛i在条件else(H否则把aj上移ai=aUJ;j=2*i+l;ai=temp;利用上i在c巳ateHeap(a,1 循环调用er巳ateHeap(a,n.h)的过程初始化创建最大推算法如下public static void initCreateHeap(intO a)(int n=a.Length;for(int i=(n-1-1)12;i=O;i 一)
48、createHeap(a,口,i);3怎样进行整个序列的旅排序?事基于初始堆进行堆排序的算法步骤堆的第一个对象a(OJ具有最大的关键码,将a(OJ及an-1对i闷,把具有最大关键码的对象交换到最后;再对前丽的n-1个对象,使用堆的调整算法,重新建立堆(调整根结点佼之满足最大堆的定义。结果具有次最大关键码的对象又上浮到堆顶,llPaOJ位置;再对if.lJa(OJ和an-2,然后对前n-2个对象重新调骤,如此反复,最后得到全部排序好的对象序列。例5:对刚才建好的最大堆j进行徘序public static void heapSort(intJ a)(int temp;int n=a.L巳ngth;
49、initCreateHeap(a);H初始化创建最大堆for(int i=1卜I;i O;i一)H当前最大堆个数每次i羞减lH把堆顶aOJ元索和当前最大堆的最后一个元素交换temp=aO;12 I 16 aO)=ai;ai=temp;createHeap(町,0);4、堆排序算法分析:时间效率O(nlog2n).空间效率0(1).稳定性不稳定。练习l以下序列是堆的是)数据结构知识点总结Iii用整1丧生自点满足最大堆75,65,30,15,25,45,20,10 B.75,65,45,10,30,25,20,l 5 C.(75,45,65,30,15,25,20,10 D.75,45,65,10
50、,25,30,20,l 5 练习2:有一组数据15,9,7,8,20,1,7气4),建成的最小雄为 A.(1人8,9,20,7,15,7*)C.(1,4,7,8,20,15,7飞9)练习3:己知序列503.87,时的排序过程。B.(I几15,7气4,8,20,9)D 以上都不对512.,61,908.,170,897,275,653,462),写出采用堆排序对该序歹lj作非递减排列排J字好的序列为:61,87,170,275,462,503,512,653,897,908 10.4交换排序交换排序的基本思想是:利用交换数据元素的位置进行排序的方法。交换排序的主要算法有:I)冒泡排序2)快速排序