《高度平衡的二叉树优秀课件.ppt》由会员分享,可在线阅读,更多相关《高度平衡的二叉树优秀课件.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高度平衡的二叉树第1页,本讲稿共79页 二叉搜索树性能分析二叉搜索树性能分析n对于有对于有 n 个关键码的集合,其关键码有个关键码的集合,其关键码有 n!种不同排种不同排列,可构成不同二叉搜索树有列,可构成不同二叉搜索树有 (棵棵)2,1,3 1,2,3 1,3,2 2,3,1 3,1,2 3,2,1 123111132223323第2页,本讲稿共79页n同样同样 3 个数据个数据 1,2,3,输入顺序不同,建立起来,输入顺序不同,建立起来的二叉搜索树的形态也不同。这直接影响到二叉搜的二叉搜索树的形态也不同。这直接影响到二叉搜索树的搜索性能。索树的搜索性能。n如果输入序列选得不好,会建立起一棵
2、单支树,如果输入序列选得不好,会建立起一棵单支树,使得二叉搜索树的高度达到最大。使得二叉搜索树的高度达到最大。n用树的搜索效率来评价这些二叉搜索树。用树的搜索效率来评价这些二叉搜索树。n为此,在二叉搜索树中加入外结点,形成判定树。为此,在二叉搜索树中加入外结点,形成判定树。外结点表示失败结点,内结点表示搜索树中已有外结点表示失败结点,内结点表示搜索树中已有的数据。的数据。n这样的判定树即为这样的判定树即为扩充的二叉搜索树扩充的二叉搜索树。第3页,本讲稿共79页n举例说明。已知关键码集合举例说明。已知关键码集合 a1,a2,a3=do,if,to,对应搜索概率,对应搜索概率p1,p2,p3,在各
3、搜索不成功间隔内在各搜索不成功间隔内搜索概率分别为搜索概率分别为q0,q1,q2,q3。可能的二叉搜索树如。可能的二叉搜索树如下所示。下所示。doiftodoiftoq0q1p1q2p2q3p3q0q1q2q3p1p2p3(a)(b)第4页,本讲稿共79页判定树判定树doiftoq0q1p1q2p2q3p3doiftoq0q1p1q2p2q3p3(d)(c)doiftoq0q1p1q2p2q3p3(e)第5页,本讲稿共79页n在判定树中在判定树中 表表示示内内部部结结点点,包包含含了了关关键键码码集集合合中中的的某某一一个关键码;个关键码;表表示示外外部部结结点点,代代表表各各关关键键码码间间
4、隔隔中中的的不不在在关关键码集合中的关键码。键码集合中的关键码。n在每两个外部结点间必存在一个内部结点在每两个外部结点间必存在一个内部结点。n一一棵棵判判定定树树上上的的搜搜索索成成功功的的平平均均搜搜索索长长度度ASLsucc可可以以定定义义为为该该树树所所有有内内部部结结点点上上的的搜搜索索概概率率pi与与搜搜索索该该结结点点时时所所需需的的关关键键码码比比较较次次数数ci(=li,即结点所在层次即结点所在层次)乘积之和:乘积之和:第6页,本讲稿共79页n设各关键码的搜索概率相等:设各关键码的搜索概率相等:pi=1/nn搜索不成功的平均搜索长度搜索不成功的平均搜索长度ASLunsucc为树
5、中所有外为树中所有外部结点上搜索概率部结点上搜索概率qj与到达外部结点所需关键码与到达外部结点所需关键码比较次数比较次数cj(=lj)乘积之和:乘积之和:n设外部结点搜索概率相等:设外部结点搜索概率相等:qj=1/(n+1):第7页,本讲稿共79页n设树中所有内、外部结点的搜索概率都相等:设树中所有内、外部结点的搜索概率都相等:pi=1/3,1i3,qj=1/4,0 j3 图图(a):ASLsucc=1/3*3+1/3*2+1/3*1=6/3,ASLunsucc=1/4*3*2+1/4*2+1/4*1=9/4。图图(b):ASLsucc=1/3*2*2+1/3*1=5/3,ASLunsucc=
6、1/4*2*4=8/4。图图(c):ASLsucc=1/3*1+1/3*2+1/3*3=6/3,ASLunsucc=1/4*1+1/4*2+1/4*3*2=9/4。图图(d):ASLsucc=1/3*2+1/3*3+1/3*1=6/3,ASLunsucc=1/4*2+1/4*3*2+1/4*1=9/4。(1)相等搜索概率的情形相等搜索概率的情形第8页,本讲稿共79页图图(e):ASLsucc=1/3*1+1/3*3+1/3*2=6/3,ASLunsucc=1/4*1+1/4*3*2+1/4*2=9/4。n图图(b)的情形所得的平均搜索长度最小。的情形所得的平均搜索长度最小。第9页,本讲稿共79
7、页n设二叉搜索树中所有内、外部结点的搜索概率互设二叉搜索树中所有内、外部结点的搜索概率互不相等。不相等。p1=0.5,p2=0.1,p3=0.05 q0=0.15,q1=0.1,q2=0.05,q3=0.05n分别计算各个可能的扩充二叉搜索树的搜索性分别计算各个可能的扩充二叉搜索树的搜索性能,判断哪些扩充二叉搜索树的平均搜索长度能,判断哪些扩充二叉搜索树的平均搜索长度最小。最小。(2)不相等搜索概率的情形不相等搜索概率的情形第10页,本讲稿共79页doiftodoiftoq0=0.15q1=0.1p1=0.5q2=0.05p2=0.1q3=0.05p3=0.05q0=0.15 q1=0.1 q
8、2=0.05q3=0.05p1=0.5p2=0.1p3=0.05(a)(b)图图(a):ASLsucc=0.5*3+0.1*2+0.05*1=1.75,ASLunsucc=0.15*3+0.1*3+0.05*2+0.05*1=0.9。图图(b):ASLsucc=0.5*2+0.1*1+0.05*2=1.2,ASLunsucc=(0.15+0.1+0.05+0.05)*2=0.7。第11页,本讲稿共79页doifto q0=0.15q1=0.1p1=0.5q2=0.05p2=0.1q3=0.05p3=0.05doiftoq0=0.15q1=0.1p1=0.5q2=0.05p2=0.1q3=0.0
9、5p3=0.05(d)(c)图图(c):ASLsucc=0.5*1+0.1*2+0.05*3=0.85,ASLunsucc=0.15*1+0.1*2+0.05*3+0.05*3 =0.75.图图(d):ASLsucc=0.5*2+0.1*3+0.05*1=1.35,ASLunsucc=0.15*2+0.1*3+0.05*3+0.05*1=0.8.第12页,本讲稿共79页n由此可知,图由此可知,图(c)和图和图(e)的情形下树的平均搜索的情形下树的平均搜索长度达到最小,因此,图长度达到最小,因此,图(c)和图和图(e)的情形是最的情形是最优二叉搜索树。优二叉搜索树。doiftoq0=0.15q1
10、=0.1p1=0.5q2=0.05p2=0.1q3=0.05p3=0.05(e)图图(e):ASLsucc=0.5*1+0.1*3+0.05*2=0.9;ASLunsucc=0.15*1+0.1*3+0.05*3+0.05*2=0.7;第13页,本讲稿共79页n一般把平均搜索长度达到最小的扩充的二一般把平均搜索长度达到最小的扩充的二叉搜索树称作最优二叉搜索树。叉搜索树称作最优二叉搜索树。n等概率条件下,最优二叉搜索树的最短内等概率条件下,最优二叉搜索树的最短内部路径长度与最短外部路径长度部路径长度与最短外部路径长度,课本课本383页页:第14页,本讲稿共79页 一、什么是平衡二叉树 二、失衡二
11、叉排序树的分析与调整 平衡二叉树第15页,本讲稿共79页平衡二叉树又称为平衡二叉树又称为AVL树。树。一棵平衡二叉树或者是空树,或者是具有下列性质一棵平衡二叉树或者是空树,或者是具有下列性质一棵平衡二叉树或者是空树,或者是具有下列性质一棵平衡二叉树或者是空树,或者是具有下列性质的二叉排序树:的二叉排序树:的二叉排序树:的二叉排序树:左子树与右子树的高度之差的绝对值小于等于左子树与右子树的高度之差的绝对值小于等于1;左子树和右子树也是平衡二叉排序树。左子树和右子树也是平衡二叉排序树。第16页,本讲稿共79页例:平衡二叉树40247053452860 引入平衡二叉树的目的是为了提高查找效率,引入平
12、衡二叉树的目的是为了提高查找效率,使其平均使其平均查找长度为查找长度为O(log2n)。402470532860第17页,本讲稿共79页 根据平衡二叉树的定义,根据平衡二叉树的定义,平衡二叉树上所有结点平衡二叉树上所有结点的平衡因子只能是的平衡因子只能是-1、0,或,或1。当我们在一个平衡二。当我们在一个平衡二叉排序树上插入一个结点时,有可能导致失衡,即出叉排序树上插入一个结点时,有可能导致失衡,即出现绝对值大于现绝对值大于1的平衡因子,如的平衡因子,如2、-2。为了方便起见,给每个结点附加一个为了方便起见,给每个结点附加一个数字数字数字数字,给出,给出该结点该结点该结点该结点左子树与右子树的
13、高度差左子树与右子树的高度差左子树与右子树的高度差左子树与右子树的高度差。这个数字称为结点的。这个数字称为结点的平衡因子。平衡因子。平衡因子。平衡因子。第18页,本讲稿共79页40247053452860402470532860例:下图对平衡二叉树和失去平衡的二叉排序树分别下图对平衡二叉树和失去平衡的二叉排序树分别标注了平衡因子。标注了平衡因子。0 01 1-1-1-1-10 00 0-1-11 10 0-1-1-2-20 0-1-1第19页,本讲稿共79页 一、什么是平衡二叉树 二、失衡二叉排序树的分析与调整 平衡二叉树第20页,本讲稿共79页 如果在一棵如果在一棵AVL树中插入一个新结点,
14、就有可能造成失衡,树中插入一个新结点,就有可能造成失衡,此时必须此时必须重新调整树的结构重新调整树的结构重新调整树的结构重新调整树的结构,使之恢复平衡。我们称调整,使之恢复平衡。我们称调整平衡过程为平衡过程为平衡旋转平衡旋转平衡旋转平衡旋转。现分别介绍这四种平衡旋转。现分别介绍这四种平衡旋转。平衡旋转可以归纳为四类:平衡旋转可以归纳为四类:平衡旋转可以归纳为四类:平衡旋转可以归纳为四类:v LL平衡旋转平衡旋转v RR平衡旋转平衡旋转v LR平衡旋转平衡旋转v RL平衡旋转平衡旋转第21页,本讲稿共79页若在若在A的的左子树的左子树上插入左子树的左子树上插入左子树的左子树上插入左子树的左子树上
15、插入结点,使结点,使A的平衡因的平衡因子从子从1增加至增加至2,需要进行一次,需要进行一次顺时针旋转顺时针旋转顺时针旋转顺时针旋转。(以以以以B B为旋转轴)为旋转轴)为旋转轴)为旋转轴)1)LL平衡旋转:平衡旋转:A AB BC CA AB BC C第22页,本讲稿共79页右单旋转右单旋转 (RotateRight)(RotateRight)hhhACEBD(a)(b)(c)hh+1BACEDhhh+1CEABD在左子树在左子树在左子树在左子树D D上插入新结点使其高度增上插入新结点使其高度增上插入新结点使其高度增上插入新结点使其高度增1 1,导致结点,导致结点,导致结点,导致结点A A的的
16、的的平衡因子增到平衡因子增到平衡因子增到平衡因子增到 -2-2,造成了不平衡。,造成了不平衡。,造成了不平衡。,造成了不平衡。为使树恢复平衡,从为使树恢复平衡,从为使树恢复平衡,从为使树恢复平衡,从A A沿插入路径连续取沿插入路径连续取沿插入路径连续取沿插入路径连续取3 3个结点个结点个结点个结点A A、B B和和和和D D,它们处于一条方向为,它们处于一条方向为,它们处于一条方向为,它们处于一条方向为“/”的直线上,需要做的直线上,需要做的直线上,需要做的直线上,需要做右单旋转。右单旋转。右单旋转。右单旋转。以结点以结点以结点以结点B B为旋转轴,将结点为旋转轴,将结点为旋转轴,将结点为旋转
17、轴,将结点A A顺时针旋转顺时针旋转顺时针旋转顺时针旋转。h0 00 00 0-1 1-1 1-2 2第23页,本讲稿共79页 左改组(新插入结点出现在危机结点的左子树上进行的调整)左改组(新插入结点出现在危机结点的左子树上进行的调整)的情况分析:的情况分析:1、LL 情况:(情况:(LL:表示新插入结点在危机结点的:表示新插入结点在危机结点的 左子树左子树的的左子树上左子树上)AB+1h-10+2+1hh-1h-1LL 改组改组BLBRARBA0h0h-1h-1BLBRAR危机结点危机结点改组前:高度为改组前:高度为 h+1 中序序列:中序序列:ABBLBRAR改组后:高度为改组后:高度为
18、h+1 中序序列:中序序列:ABBLBRAR注意:改组后注意:改组后 平衡度为平衡度为 0AB第24页,本讲稿共79页若在若在A的的右子树的右子树上插入右子树的右子树上插入右子树的右子树上插入右子树的右子树上插入结点,使结点,使A的平衡因子从的平衡因子从-1增加至增加至-2,需要进行一次,需要进行一次逆时针旋转逆时针旋转逆时针旋转逆时针旋转。(以以以以B B为旋转轴)为旋转轴)为旋转轴)为旋转轴)2 2)RRRR平衡旋转:平衡旋转:A AB BC CA AB BC C第25页,本讲稿共79页左单旋转左单旋转 (RotateLeft)(RotateLeft)hhhACEBD(a)(b)(c)hh
19、h+1BACEDhhh+1CEABD如如如如果果果果在在在在子子子子树树树树E E中中中中插插插插入入入入一一一一个个个个新新新新结结结结点点点点,该该该该子子子子树树树树高高高高度度度度增增增增1 1导导导导致致致致结点结点结点结点A A的平衡因子变成的平衡因子变成的平衡因子变成的平衡因子变成+2+2,出现不平衡。,出现不平衡。,出现不平衡。,出现不平衡。沿沿沿沿插插插插入入入入路路路路径径径径检检检检查查查查三三三三个个个个结结结结点点点点A A、C C和和和和E E。它它它它们们们们处处处处于于于于一一一一条条条条方方方方向为向为向为向为“”的直线上,需要做左单旋转。的直线上,需要做左单
20、旋转。的直线上,需要做左单旋转。的直线上,需要做左单旋转。以结点以结点以结点以结点C C为旋转轴,让结点为旋转轴,让结点为旋转轴,让结点为旋转轴,让结点A A反时针旋转。反时针旋转。反时针旋转。反时针旋转。+1+1+2+20 0+1+10 00 0第26页,本讲稿共79页若在若在A的的左左左左子树的子树的子树的子树的右右右右子树上插入子树上插入子树上插入子树上插入结点,使结点,使A的平衡因的平衡因子从子从1增加至增加至2,需要,需要先进行先进行先进行先进行逆逆逆逆时针旋转时针旋转时针旋转时针旋转,再再再再顺顺顺顺时针旋转时针旋转时针旋转时针旋转。(以插入的结点以插入的结点以插入的结点以插入的结
21、点C C为旋转轴)为旋转轴)为旋转轴)为旋转轴)A AB BC CA AB BC CA AB BC C3)LR平衡旋转:平衡旋转:第27页,本讲稿共79页2、LR 情况:(情况:(LR:表示新插入结点在危机结点的:表示新插入结点在危机结点的 左子树左子树的的右子树上右子树上)情况情况A:AB+1h-10+2-1h-1LR 改组改组BLAR危机结点危机结点改组前:改组前:高度为高度为 h+1 中序序列:中序序列:注意:改组后注意:改组后 平衡度为平衡度为 0,0,-1CBCCLCRh-2h-2h-10+1CB0h-1h-1BLARACRh-2CLh-1-10ABBLARCCLCR改组后:改组后:
22、高度为高度为 h+1 中序序列:中序序列:ABBLARCCLCRA第28页,本讲稿共79页Double RotationsFig.28-7(a)The AVL tree in Fig.28-5 after additions that maintain its balance;(b)after an addition that destroys the balance continued 第29页,本讲稿共79页Double RotationsFig.28-7(ctd.)(c)after a left rotation;(d)after a right rotation.第30页,本讲稿共79
23、页若在若在A的的右右右右子树的子树的子树的子树的左左左左子树上插入子树上插入子树上插入子树上插入结点,使结点,使A的平衡因子从的平衡因子从-1增加至增加至-2,需要,需要先进行先进行先进行先进行顺顺顺顺时针旋转时针旋转时针旋转时针旋转,再再再再逆逆逆逆时针旋转时针旋转时针旋转时针旋转。(以插入的结点以插入的结点以插入的结点以插入的结点C C为旋转轴)为旋转轴)为旋转轴)为旋转轴)4 4 4 4)RLRLRLRL平衡旋转:平衡旋转:平衡旋转:平衡旋转:A AB BC CA AB BC CA AB BC C这种调整规则可以保证二叉排序树的次序不变这种调整规则可以保证二叉排序树的次序不变这种调整规则
24、可以保证二叉排序树的次序不变这种调整规则可以保证二叉排序树的次序不变第31页,本讲稿共79页 综综上上所所述述,在在一一个个平平衡衡二二叉叉排排序序树树上上插插入入一一个个新新结点结点S时,主要包括以下三步:时,主要包括以下三步:(1)查查找找应应插插位位置置,同同时时记记录录离离插插入入位位置置最最近近的的可可能能失衡结点失衡结点A(A的平衡因子不等于的平衡因子不等于0)。)。(2)插插入入新新结结点点S,并并修修改改从从A到到S路路径径上上各各结结点点的的平平衡因子。衡因子。(3)根据根据A、B的平衡因子,的平衡因子,判断是否失衡以及失衡判断是否失衡以及失衡类型,类型,并做相应处理。并做相
25、应处理。第32页,本讲稿共79页Double RotationsFig.28-5(a)Adding 70 to the tree in Fig.28-2c destroys its balance;to restore the balance,perform both(b)a right rotation and(c)a left rotation.第33页,本讲稿共79页0 0131313130 0373737370 024242424例:例:请将下面序列构成一棵平衡二叉排序树:请将下面序列构成一棵平衡二叉排序树:(13,24,37,90,53)0 0131313130 037373737-
26、1-1131313130 024242424-1-124242424-2-2-2-213131313需要需要RR平衡旋转平衡旋转(绕绕B逆转逆转,B为根)为根)0 090909090-1-124242424-1-1373737370 0535353531 190909090-2-2-2-237373737需要需要RL平衡旋平衡旋转转(绕绕C先顺后先顺后逆)逆)0 0373737370 0909090900 0535353530 0373737370 0909090900 053535353第34页,本讲稿共79页n例如,输入关键码序列为例如,输入关键码序列为 16,3,7,11,9,26,18
27、,14,15,插入插入和调整过程如下。和调整过程如下。160163-10左右双旋左右双旋左右双旋左右双旋731600073110-1116右单旋右单旋右单旋右单旋37169000111163701-273161190-1-223711269160112第35页,本讲稿共79页右左双旋右左双旋0左单旋左单旋181600732611900031609171126183-1-1716142691112 27390 0182611-1 1161 1第36页,本讲稿共79页15182 231816-2 2左右双旋左右双旋左右双旋左右双旋730 00 00 0117149-1 116150 01 1112
28、626141 1-2 29从空树开始的建树过程从空树开始的建树过程第37页,本讲稿共79页各种搜索结构的比较n课本397页 图10.14第38页,本讲稿共79页作业n1、设有关键码序列55,31,11,37,46,73,63,02,07,从空树开始构造平衡二叉搜索树,画出每加入一个新结点时二叉树的形态。第39页,本讲稿共79页伸展树(伸展树(Splaying TreeSplaying Tree)n伸展树、伸展树、AVL树、并查集的用双亲表示的树,都树、并查集的用双亲表示的树,都属于自调整数据结构(属于自调整数据结构(self-adjusting data structure)。)。nAVL树使
29、得搜索树保持高度平衡,让叶结点只出树使得搜索树保持高度平衡,让叶结点只出现在最低的一层或两层上,从而提高其搜索效率。现在最低的一层或两层上,从而提高其搜索效率。n伸展树是另一种提高搜索效率的方法,其思路是:伸展树是另一种提高搜索效率的方法,其思路是:1.单一旋转:单一旋转:将经常访问的结点最终上移到靠将经常访问的结点最终上移到靠近根的地方,使以后的访问更快。近根的地方,使以后的访问更快。第40页,本讲稿共79页2.移动到根部:移动到根部:假设正访问的结点将以很高的概假设正访问的结点将以很高的概率再次被访问,对它反复进行子女率再次被访问,对它反复进行子女父结点旋父结点旋转,直到被访问的结点位于根
30、部为止。转,直到被访问的结点位于根部为止。n伸展树提出了一组改进二叉搜索树性能的一组伸展树提出了一组改进二叉搜索树性能的一组规则,每当执行搜索、插入、删除等操作时,规则,每当执行搜索、插入、删除等操作时,就要依据这些规则调整二叉搜索树,从而保证就要依据这些规则调整二叉搜索树,从而保证操作的时间代价。操作的时间代价。n每当访问(搜索、插入或删除)一个结点每当访问(搜索、插入或删除)一个结点 s 时,时,伸展树就执行一次叫做伸展树就执行一次叫做“展开展开(splaying)”的过程,的过程,将将结点结点 s 移到二叉搜索树的根部移到二叉搜索树的根部。第41页,本讲稿共79页n就像就像AVL树,一次
31、树,一次“展开展开”由一组旋转组成。由一组旋转组成。n旋转有三种类型:旋转有三种类型:单旋转单旋转、一字形旋转一字形旋转和和之字形之字形旋转旋转。n一次旋转的目的是通过调整一次旋转的目的是通过调整结点结点 s 与它的与它的父结点父结点 p 和和祖父结点祖父结点 g 之间位置,把它上移到树的更高层。之间位置,把它上移到树的更高层。1.被访问结点被访问结点 s 的父结点的父结点 p 是是根结点根结点。此时执行。此时执行单单旋转旋转。在保持二叉搜索树特性的情况下,结点。在保持二叉搜索树特性的情况下,结点 s 成为新的根,原来的根成为新的根,原来的根 p 成为它的子女结点。成为它的子女结点。第42页,
32、本讲稿共79页2.同构形状(同构形状(homogeneous configuration)。结点。结点 s 是其父结点是其父结点 p 的左子女,结点的左子女,结点 p 又是其父结点又是其父结点 g 的左子女的左子女()。或者结点。或者结点 s 是其父结点是其父结点 p 的右子的右子女,结点女,结点 p 又是其父结点又是其父结点g 的右子女的右子女()。此时。此时执行执行一字形旋转一字形旋转(zigzig rotation):p s s p右单旋转第43页,本讲稿共79页n异构的形状(异构的形状(heterogeneous configuration)。结点。结点 s 是其父结点是其父结点 p
33、的左子女,结点的左子女,结点 p 又是其父结点又是其父结点 g 的的右子女右子女()。或结点。或结点 s 是其父结点是其父结点 p 的右子女,结的右子女,结点点 p 又是其父结点又是其父结点 g 的左子女的左子女()。此时执行。此时执行之字之字形旋转形旋转(zigzag rotation)。pg s pg s pg s 右单旋转右单旋转第44页,本讲稿共79页n因为刚访问的因为刚访问的结点结点 s 与其父结点与其父结点 p 和祖父结点和祖父结点g 形形成折线成折线,需要做与,需要做与AVL树一样的树一样的双旋转双旋转,首先围,首先围绕绕 s 旋转旋转 p,再围绕,再围绕 s 旋转旋转 g,把结
34、点,把结点 s上升到祖父上升到祖父结点的位置,并保持二叉搜索树的特性。结点的位置,并保持二叉搜索树的特性。pg s pg s sg p 左单旋转右单旋转第45页,本讲稿共79页将刚访问的结点将刚访问的结点s s上移到树根部的算法上移到树根部的算法 splaying(g,p,s)/g 是 p 的父结点,p 是 s 的父结点/算法将s移到根结点位置 while(s 不是树的根结点不是树的根结点)if(s 的父结点是根结点的父结点是根结点)进行单旋转进行单旋转,将将 s 调整为根结点调整为根结点 else if(s 与它的前驱与它的前驱 p,g 是同构形状是同构形状)进行一字形双旋转,将进行一字形双
35、旋转,将 s 上移上移 else/s 与它的前驱与它的前驱 p,g 是异构形状是异构形状 进行之字形双旋转,将进行之字形双旋转,将 s 上移上移;第46页,本讲稿共79页伸展树的性能分析伸展树的性能分析n之字形旋转之字形旋转使得树结构趋向于平衡化,结果常常使树使得树结构趋向于平衡化,结果常常使树结构的高度减少结构的高度减少1。而。而一字形旋转一字形旋转一般不会降低树结一般不会降低树结构的高度,它只是把刚访问的结点向根结点上移。构的高度,它只是把刚访问的结点向根结点上移。n伸展树不要求每一个操作都是高效的,对于一个有伸展树不要求每一个操作都是高效的,对于一个有 n 个结点的树,执行个结点的树,执
36、行 m 次操作时可能一次插入或次操作时可能一次插入或搜索操作需要花费搜索操作需要花费O(n)时间。时间。n例如,对于一个有例如,对于一个有 n 个结点的单支树,访问最底层的个结点的单支树,访问最底层的结点,需要时间即为结点,需要时间即为O(n)。第47页,本讲稿共79页n当当mn时,所有时,所有m个操作总共需要个操作总共需要O(mlog2n)时间,时间,从而使每次访问操作的所花费的平均时间达到从而使每次访问操作的所花费的平均时间达到O(log2n),从整体上保持较高的时间性能。,从整体上保持较高的时间性能。n下面的实例描述了伸展树如何通过下面的实例描述了伸展树如何通过“展开展开”实现自实现自调
37、整。首先在伸展树中搜索调整。首先在伸展树中搜索70,搜索过程与二叉搜,搜索过程与二叉搜索树完全一样,一旦搜索成功,就执行索树完全一样,一旦搜索成功,就执行“展开展开”过程将该结点上移到根结点位置。过程将该结点上移到根结点位置。n伸展树的插入操作与二叉搜索树相同,但结点一伸展树的插入操作与二叉搜索树相同,但结点一经插入之后立即展开到根结点。经插入之后立即展开到根结点。第48页,本讲稿共79页608030201070409050608030201070409050608030201070409050608030201070409050zigzig双旋转双旋转zigzag双旋转双旋转左单旋转左单旋转
38、70调整完调整完第49页,本讲稿共79页n从伸展树中删除一个结点的操作也与二叉搜索树相从伸展树中删除一个结点的操作也与二叉搜索树相同,但需要把被删结点的父结点展开到根结点。同,但需要把被删结点的父结点展开到根结点。n伸展树与伸展树与AVL树在操作上稍有不同。伸展树的调树在操作上稍有不同。伸展树的调整与结点被访问(包括搜索、插入、删除)的频率整与结点被访问(包括搜索、插入、删除)的频率有关,能够进行更合理的调整。而有关,能够进行更合理的调整。而AVL树的结构树的结构调整只与插入、删除的顺序有关,与访问的频调整只与插入、删除的顺序有关,与访问的频率无关。率无关。第50页,本讲稿共79页红黑树(红黑
39、树(Red-Black TreeRed-Black Tree)n红黑树是一棵二叉搜索树:树中的每一个结点红黑树是一棵二叉搜索树:树中的每一个结点的颜色不是黑色就是红色。可以把一棵红黑树的颜色不是黑色就是红色。可以把一棵红黑树视为一棵扩充二叉树,用外部结点表示空指针。视为一棵扩充二叉树,用外部结点表示空指针。其特性描述如下:其特性描述如下:特性特性1:根结点和所有外部结点的颜色是根结点和所有外部结点的颜色是黑色黑色。特性特性2:从根结点到外部结点的途中没有连续从根结点到外部结点的途中没有连续两个结点的颜色是两个结点的颜色是红色红色。特性特性3:所有从根到外部结点的路径上都有相同所有从根到外部结点
40、的路径上都有相同数目的数目的黑色结点黑色结点。第51页,本讲稿共79页n从红黑树中任一结点从红黑树中任一结点 x 出发出发(不包括结点不包括结点 x),到达,到达一个外部结点的任一路径上的黑结点个数叫做一个外部结点的任一路径上的黑结点个数叫做结点结点 x 的黑高度,称为结点的阶的黑高度,称为结点的阶(rank),记作,记作 bh(x)。红黑树的黑高度定义为其根结点的黑高度。红黑树的黑高度定义为其根结点的黑高度。501030204060702050红色结点红色结点黑色结点黑色结点外部结点外部结点第52页,本讲稿共79页n另一种等价的定义是看结点指针的颜色。另一种等价的定义是看结点指针的颜色。n从
41、父结点到黑色子女结点的指针为黑色的,从父结从父结点到黑色子女结点的指针为黑色的,从父结点到红色子女结点的指针为红色的。点到红色子女结点的指针为红色的。50103020406070第53页,本讲稿共79页特性特性1:从内部结点指向外部结点的指针是黑色从内部结点指向外部结点的指针是黑色的。的。特性特性2:从根结点到外部结点的途中没有两个从根结点到外部结点的途中没有两个连续的红色指针。连续的红色指针。特性特性3:所有根到外部结点的路径上都有相所有根到外部结点的路径上都有相同数目的黑色指针。同数目的黑色指针。n如果知道指针的颜色,就能推断结点的颜色,反之如果知道指针的颜色,就能推断结点的颜色,反之亦然
42、。亦然。n设从根到外部结点的路径长度设从根到外部结点的路径长度(Path Length,PL)为该路径上指针的个数,为该路径上指针的个数,第54页,本讲稿共79页n结论结论1 如果如果P与与Q是红黑树中的两条从根到外部是红黑树中的两条从根到外部结点的路径,则有:结点的路径,则有:PL(P)2PL(Q)证明:证明:考查任意一棵红黑树。假设根结点的黑高度考查任意一棵红黑树。假设根结点的黑高度bh(root)=r。由特性。由特性1可知,每条从根结点到外可知,每条从根结点到外部结点的路径中最后一个指针为黑色;从特性部结点的路径中最后一个指针为黑色;从特性2可知,不存在有连续两个红色指针的路径。因此,可
43、知,不存在有连续两个红色指针的路径。因此,每个红色指针后面都会跟随一个黑色指针,每条从每个红色指针后面都会跟随一个黑色指针,每条从根到外部结点的路径上都有根到外部结点的路径上都有r2r个指针,综上所述个指针,综上所述有有 PL(P)2PL(Q)。第55页,本讲稿共79页n如上图,从根到如上图,从根到 40 左下的外部结点的路径长度左下的外部结点的路径长度PL(40)=4,从根到,从根到70右下的外部结点的路径长度右下的外部结点的路径长度PL(70)=3,因此,因此PL(40)PL(70)或者或者PL(70)PL(40)。50103020406070PL=4,bh=2 PL=3,bh=2第56页
44、,本讲稿共79页n结论结论2 设设 h 是一棵红黑树的高度是一棵红黑树的高度(不包括外部结点不包括外部结点),n 是树中内部结点的个数,是树中内部结点的个数,r 是根结点的黑高度,是根结点的黑高度,则以下关系式成立:则以下关系式成立:(1)h2r(2)n2r-1(3)h2log2(n+1)证明:证明:(1)从结论从结论1的证明可知,从根到任一外部结点的的证明可知,从根到任一外部结点的路径长度不超过路径长度不超过2r,同时从树的定义可知,树的高,同时从树的定义可知,树的高度即为根结点的高度,等于从根到离根最远的外部结度即为根结点的高度,等于从根到离根最远的外部结点的路径的长度,有点的路径的长度,
45、有h2r。第57页,本讲稿共79页(2)因为红黑树的黑高度为因为红黑树的黑高度为r,则从树的第,则从树的第 1 层到第层到第 r 层没有外部结点,在这些层中有层没有外部结点,在这些层中有2r-1个内部结个内部结点,即内部结点的总数至少为点,即内部结点的总数至少为2r-1。(3)由由(2)可得可得rlog2(n+1),结合,结合(1),有,有h2log2(n+1)。n由于红黑树的高度最大为由于红黑树的高度最大为2log2(n+1),所以搜索、,所以搜索、插入、删除操作的时间复杂性为插入、删除操作的时间复杂性为O(log2n)。注意,最。注意,最差情况下的红黑树的高度大于最差情况下具有相差情况下的
46、红黑树的高度大于最差情况下具有相同结点个数的同结点个数的AVL树的高度(近似于树的高度(近似于1.44*log2(n+2))。)。第58页,本讲稿共79页红黑树的搜索红黑树的搜索 n由于每一棵红黑树都是二叉搜索树,可以使用由于每一棵红黑树都是二叉搜索树,可以使用二叉搜索树的算法进行搜索。在搜索过程中不二叉搜索树的算法进行搜索。在搜索过程中不需使用颜色信息。需使用颜色信息。n对普通二叉搜索树进行搜索的时间复杂性为对普通二叉搜索树进行搜索的时间复杂性为O(h),对于红黑树则为,对于红黑树则为O(log2n)。因为在搜索二。因为在搜索二叉搜索树、叉搜索树、AVL树和红黑树时使用了相同算法。在树和红黑
47、树时使用了相同算法。在最差情况下最差情况下AVL树的高度最小,因此,在那些以树的高度最小,因此,在那些以搜索操作为主的应用程序中,最差情况下搜索操作为主的应用程序中,最差情况下AVL树树能获得最优时间复杂性。能获得最优时间复杂性。第59页,本讲稿共79页红黑树的插入红黑树的插入 n首先使用二叉搜索树的插入算法将一个元素插入到首先使用二叉搜索树的插入算法将一个元素插入到红黑树中,该元素将作为新的叶结点插入。在插入红黑树中,该元素将作为新的叶结点插入。在插入过程中需要为新元素染色。过程中需要为新元素染色。1.如果插入前是空树,则那么新元素将成为根结点,如果插入前是空树,则那么新元素将成为根结点,根
48、据特征根据特征1,根结点必须染成黑色。,根结点必须染成黑色。第60页,本讲稿共79页2.如果插入前树非空,若新结点被染成黑色,将如果插入前树非空,若新结点被染成黑色,将违反红黑树的特性违反红黑树的特性3,所有从根到外部结点的路所有从根到外部结点的路径上的黑色结点个数不等径上的黑色结点个数不等。因此,新插入的结。因此,新插入的结点将染成红色,但这又可能违反红黑树的特性点将染成红色,但这又可能违反红黑树的特性2,出现连续两个红色结点,因此需要重新平,出现连续两个红色结点,因此需要重新平衡。衡。guuL插入第61页,本讲稿共79页n设新插入的结点为设新插入的结点为u,它的父结点和祖父结点分,它的父结
49、点和祖父结点分别是别是pu和和gu,现在来考查不平衡的类型。若,现在来考查不平衡的类型。若pu是黑是黑色结点,则特性色结点,则特性2没有破坏,结束重新平衡的过没有破坏,结束重新平衡的过程。若程。若pu是红色结点,则出现连续两个红色结点是红色结点,则出现连续两个红色结点的情形,这时还要考查的情形,这时还要考查pu的兄弟结点。的兄弟结点。插入puguugr第62页,本讲稿共79页1)如果如果pu的兄弟结点的兄弟结点gr是红色结点,此时结点是红色结点,此时结点pu的父结点的父结点gu是黑色结点,它有两个红色子女是黑色结点,它有两个红色子女结点。交换结点结点。交换结点gu和它的子女结点的颜色,和它的子
50、女结点的颜色,将可能破坏红黑树特性将可能破坏红黑树特性2的红色结点上移。的红色结点上移。puguugrpuguugruLuRpuRgrLgrRuLuRpuRgrLgrR第63页,本讲稿共79页2)如果如果pu的兄弟结点的兄弟结点gr是黑色结点,此时又有两是黑色结点,此时又有两种情况。种情况。a)u是是pu的左子女,的左子女,pu是是gu的左子女。在这的左子女。在这种情况下只要做一次右单旋转,交换一下种情况下只要做一次右单旋转,交换一下pu和和gu的颜色,就可恢复红黑树的特性,并的颜色,就可恢复红黑树的特性,并结束重新平衡过程。结束重新平衡过程。pugugrupugugruuLuRpuRgrLg