《第11章贪心算法优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第11章贪心算法优秀PPT.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第11章贪心算法2023/2/231现在学习的是第1页,共58页学习要点学习要点理解贪心算法的概念。理解贪心算法的概念。掌握贪心算法的基本要素掌握贪心算法的基本要素 最优子结构性质最优子结构性质贪心选择性质贪心选择性质理解贪心算法与动态规划算法的差异理解贪心算法与动态规划算法的差异理解贪心算法的一般理论理解贪心算法的一般理论通过应用范例学习贪心设计策略。通过应用范例学习贪心设计策略。活动安排问题;活动安排问题;最优装载问题;最优装载问题;哈夫曼编码;哈夫曼编码;单源最短路径;单源最短路径;最小生成树;最小生成树;多机调度问题。多机调度问题。贪心算法贪心算法2023/2/232现在学习的是第2页
2、,共58页 顾名思义,贪心算法总是作出在当前看来最好的选择。也顾名思义,贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的某种意义上的局部最优局部最优选择。当然,希望贪心算法得到的最终选择。当然,希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,最小生成树问题等。在一些情况下,即使贪心算法不经
3、问题,最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。能得到整体最优解,其最终结果却是最优解的很好近似。贪心算法贪心算法2023/2/233现在学习的是第3页,共58页活动安排问题活动安排问题 活动安排问题就是要在所给的活动集合中选出最大的相活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动。贪心算法题要求高效地安排一系列争用某一公共资源的活动。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能
4、兼容地使提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。用公共资源。2023/2/234现在学习的是第4页,共58页活动安排问题活动安排问题 设有设有n n个活动的集合个活动的集合E=1,2,E=1,2,n,n,其中每个活动都要求使用,其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。每个活动资源。每个活动i i都有一个要求使用该资源的起始时间都有一个要求使用该资源的起始时间sisi和一个结束和一个结束时间时间fi,fi,且且si fisi fi 。如果选择了活动。如果选择了活动
5、i i,则它在半开时间区间,则它在半开时间区间si,fi)si,fi)内占用资源。若区间内占用资源。若区间si,fi)si,fi)与区间与区间sj,fj)sj,fj)不相交,不相交,则称活动则称活动i i与活动与活动j j是相容的。也就是说,当是相容的。也就是说,当sifjsifj或或sjfisjfi时,时,活动活动i i与活动与活动j j相容。相容。2023/2/235现在学习的是第5页,共58页活动安排问题活动安排问题ntemplatenvoid GreedySelector(int n,Type s,Type f,bool A)nn A1=true;n int j=1;n for(int
6、 i=2;i=fj)Ai=true;j=i;n else Ai=false;n n解活动安排问题的贪心算法解活动安排问题的贪心算法GreedySelectorGreedySelector:各活动的起始时间和结束时间存储各活动的起始时间和结束时间存储于数组于数组s s和和f f中且按结束时间的非减中且按结束时间的非减序排列序排列 2023/2/236现在学习的是第6页,共58页活动安排问题活动安排问题 由于输入的活动以其完成时间的由于输入的活动以其完成时间的非减序非减序排列,所以算法排列,所以算法greedySelectorgreedySelector每次总是选择每次总是选择具有最早完成时间具有
7、最早完成时间的相容活动加入的相容活动加入集合集合A A中。直观上,按这种方法选择相容活动为未安排活动留中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是下尽可能多的时间。也就是说,该算法的贪心选择的意义是使使剩余的可安排时间段极大化剩余的可安排时间段极大化,以便安排尽可能多的相容活,以便安排尽可能多的相容活动。动。算法算法greedySelectorgreedySelector的效率极高。当输入的活动已按结束时的效率极高。当输入的活动已按结束时间的非减序排列,算法只需间的非减序排列,算法只需O(n)O(n)的时间安排的时间安排n n个活动,使最
8、多个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用减序排列,可以用O(nlogn)O(nlogn)的时间重排。的时间重排。2023/2/237现在学习的是第7页,共58页活动安排问题活动安排问题 例:设待安排的例:设待安排的1111个活动的开始时间和结束时间按结个活动的开始时间和结束时间按结束时间的非减序排列如下:束时间的非减序排列如下:i1234567891011Si130535688212fi45678910111213142023/2/238现在学习的是第8页,共58页活动安排问题活动安排问题 算法算法gr
9、eedySelector greedySelector 的计算的计算过程过程如左图所示。如左图所示。图中每行相应于算法的一次图中每行相应于算法的一次迭代。阴影长条表示的活动是迭代。阴影长条表示的活动是已选入集合已选入集合A A的活动,而空白的活动,而空白长条表示的活动是当前正在检长条表示的活动是当前正在检查相容性的活动。查相容性的活动。2023/2/239现在学习的是第9页,共58页活动安排问题活动安排问题 若被检查的活动若被检查的活动i i的开始时间的开始时间SiSi小于最近选择的活动小于最近选择的活动j j的结束的结束时间时间fifi,则不选择活动,则不选择活动i i,否则选择活动,否则选
10、择活动i i加入集合加入集合A A中。中。贪心算法并不总能求得问题的贪心算法并不总能求得问题的整体最优解整体最优解。但对于活动安排。但对于活动安排问题,贪心算法问题,贪心算法greedySelectorgreedySelector却总能求得的整体最优解,即它却总能求得的整体最优解,即它最终所确定的相容活动集合最终所确定的相容活动集合A A的规模最大。这个结论可以用数学归的规模最大。这个结论可以用数学归纳法证明。纳法证明。2023/2/2310现在学习的是第10页,共58页贪心算法的基本要素贪心算法的基本要素 着重讨论可以用贪心算法求解的问题的一般特征。着重讨论可以用贪心算法求解的问题的一般特征
11、。对于一个具体的问题,怎么知道是否可用贪心算法解此问题,对于一个具体的问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。这个问题很难给予肯定的回答。但是,从许多可以用贪心算法求解的问题中看到这类问题但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有一般具有2 2个重要的性质:个重要的性质:贪心选择性质贪心选择性质和和最优子结构性质。最优子结构性质。2023/2/2311现在学习的是第11页,共58页贪心算法的基本要素贪心算法的基本要素贪心选择性质贪心选择性质 所谓所谓贪心选择性质贪心选择性质是指所求问题的是指所求问
12、题的整体最优解整体最优解可以通过一系列可以通过一系列局部最优局部最优的选择,即贪心选择来达到。这是贪心算法可行的第的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。一个基本要素,也是贪心算法与动态规划算法的主要区别。动态规划算法通常以动态规划算法通常以自底向上自底向上的方式解各子问题,而贪心算法则的方式解各子问题,而贪心算法则通常以通常以自顶向下自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每的方式进行,以迭代的方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。作一次贪心选择就将所求问题简化为规模更小的子问题。对于
13、一个具体问题,要确定它是否具有贪心选择性质,必须证明对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。每一步所作的贪心选择最终导致问题的整体最优解。2023/2/2312现在学习的是第12页,共58页贪心算法的基本要素贪心算法的基本要素 当一个问题的最优解包含其子问题的最优解时,称此问当一个问题的最优解包含其子问题的最优解时,称此问题具有题具有最优子结构性质最优子结构性质。问题的最优子结构性质是该问题。问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。可用动态规划算法或贪心算法求解的关键特征。最优子结构性质最优子结构性质2
14、023/2/2313现在学习的是第13页,共58页贪心算法的基本要素贪心算法的基本要素 贪心算法和动态规划算法都要求问题具有最优子结构性质,贪心算法和动态规划算法都要求问题具有最优子结构性质,这是这是2 2类算法的一个共同点。但是,对于具有类算法的一个共同点。但是,对于具有最优子结构最优子结构的问的问题应该选用贪心算法还是动态规划算法求解题应该选用贪心算法还是动态规划算法求解?是否能用动是否能用动态规划算法求解的问题也能用贪心算法求解态规划算法求解的问题也能用贪心算法求解?下面研究下面研究2 2个经典的个经典的组合优化问题组合优化问题,并以此说明贪心算法与动态规划,并以此说明贪心算法与动态规划
15、算法的主要差别。算法的主要差别。贪心算法与动态规划算法的差异贪心算法与动态规划算法的差异2023/2/2314现在学习的是第14页,共58页贪心算法的基本要素贪心算法的基本要素0-10-1背包问题:背包问题:给定给定n n种物品和一个背包。物品种物品和一个背包。物品i i的重量是的重量是WiWi,其价值为,其价值为ViVi,背包的容量为背包的容量为C C。应如何选择装入背包的物品,使得装入背包中。应如何选择装入背包的物品,使得装入背包中物品的总价值最大物品的总价值最大?在选择装入背包的物品时,对每种物品在选择装入背包的物品时,对每种物品i i只有只有2 2种选择,种选择,即装入背包或不装入背包
16、。不能将物品即装入背包或不装入背包。不能将物品i i装入背包多次,也不能装入背包多次,也不能只装入部分的物品只装入部分的物品i i。2023/2/2315现在学习的是第15页,共58页贪心算法的基本要素贪心算法的基本要素背包问题:背包问题:与与0-10-1背包问题类似,所不同的是在选择物品背包问题类似,所不同的是在选择物品i i装入背包时,装入背包时,可以选择物品可以选择物品i i的一部分,的一部分,而不一定要全部装入背包,而不一定要全部装入背包,1in1in。这这2 2类问题都具有类问题都具有最优子结构最优子结构性质,极为相似,但背包问性质,极为相似,但背包问题可以用贪心算法求解,而题可以用
17、贪心算法求解,而0-10-1背包问题却不能用贪心算法背包问题却不能用贪心算法求解。求解。2023/2/2316现在学习的是第16页,共58页贪心算法的基本要素贪心算法的基本要素 首先计算每种物品单位重量的价值首先计算每种物品单位重量的价值Vi/WiVi/Wi,然后,依贪心,然后,依贪心选择策略,将尽可能多的选择策略,将尽可能多的单位重量价值最高单位重量价值最高的物品装入背包。若的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过将这种物品全部装入背包后,背包内的物品总重量未超过C C,则,则选择单位重量价值次高的物品并尽可能多地装入背包。依此策选择单位重量价值次高的物品并尽可能
18、多地装入背包。依此策略一直地进行下去,直到背包装满为止。略一直地进行下去,直到背包装满为止。具体算法可描述如下页:具体算法可描述如下页:用贪心算法解背包问题的基本步骤:用贪心算法解背包问题的基本步骤:2023/2/2317现在学习的是第17页,共58页贪心算法的基本要素贪心算法的基本要素void Knapsack(int n,float M,float v,float w,float x)Sort(n,v,w);int i;for(i=1;i=n;i+)xi=0;float c=M;for(i=1;ic)break;xi=1;c-=wi;if(i=n)xi=c/wi;算法算法knapsackk
19、napsack的主的主要计算时间在于将各种要计算时间在于将各种物品依其单位重量的价物品依其单位重量的价值从大到小排序。因此,值从大到小排序。因此,算法的计算时间上界为算法的计算时间上界为O O(nlognnlogn)。)。为了证明算法的正确性,为了证明算法的正确性,还必须证明背包问题具有还必须证明背包问题具有贪心选择性质。贪心选择性质。2023/2/2318现在学习的是第18页,共58页贪心算法的基本要素贪心算法的基本要素 对于对于0-10-1背包问题背包问题,贪心选择之所以不能得到最优解是因,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置为在这种情况下,
20、它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。事实上,在考的背包空间使每公斤背包空间的价值降低了。事实上,在考虑虑0-10-1背包问题时,应比较选择该物品和不选择该物品所导致背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用叠的子问题。这正是该问题可用动态规划算法动态规划算法求解的另一重要特求解的另一重要特征。征。实际上也是如此,动态规划算法的确可以有效地解实际上也是如此,动态规划算法的确可以有效地解0-10-1背包背包问题。问题。20
21、23/2/2319现在学习的是第19页,共58页最优装载最优装载 有一批集装箱要装上一艘载重量为有一批集装箱要装上一艘载重量为c c的轮船。其中集装的轮船。其中集装箱箱i i的重量为的重量为WiWi。最优装载问题要求确定在装载体积不受限。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。制的情况下,将尽可能多的集装箱装上轮船。1 1、算法描述、算法描述最优装载问题可用贪心算法求解。采用重量最轻者先装的最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可产生最优装载问题的最优解。具体算法描述贪心选择策略,可产生最优装载问题的最优解。具体算法描述如下页。如下
22、页。2023/2/2320现在学习的是第20页,共58页最优装载最优装载templatevoid Loading(int x,Type w,Type c,int n)int*t=new int n+1;Sort(w,t,n);for(int i=1;i=n;i+)xi=0;for(int i=1;i=n&wti=c;i+)xti=1;c-=wti;2023/2/2321现在学习的是第21页,共58页最优装载最优装载2 2、贪心选择性质、贪心选择性质 可以证明最优装载问题具有贪心选择性质。可以证明最优装载问题具有贪心选择性质。3 3、最优子结构性质、最优子结构性质最优装载问题具有最优子结构性质。
23、最优装载问题具有最优子结构性质。由最优装载问题的贪心选择性质和最优子结构性质,容由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法易证明算法loadingloading的正确性。的正确性。算法算法loadingloading的主要计算量在于将集装箱依其重量从小到的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为大排序,故算法所需的计算时间为 O(nlogn)O(nlogn)。2023/2/2322现在学习的是第22页,共58页哈夫曼编码哈夫曼编码哈夫曼编码哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在方法
24、。其压缩率通常在20%20%90%90%之间。哈夫曼编码算法用字符之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用在文件中出现的频率表来建立一个用0 0,1 1串表示各字符的最优串表示各字符的最优表示方式。表示方式。给出现频率高的字符较短的编码,出现频率较低的字符以较长的给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。编码,可以大大缩短总码长。1 1、前缀码、前缀码对每一个字符规定一个对每一个字符规定一个0,10,1串作为其代码,并要求任一字串作为其代码,并要求任一字符的代码都不是其它字符代码的前缀。这种编码称为符的代码都不是其它字符代码的前缀。这种
25、编码称为前缀码前缀码。2023/2/2323现在学习的是第23页,共58页哈夫曼编码哈夫曼编码 编码的前缀性质可以使译码方法非常简单。编码的前缀性质可以使译码方法非常简单。表示表示最优前缀码最优前缀码的二叉树总是一棵的二叉树总是一棵完全二叉树完全二叉树,即树中任一结,即树中任一结点都有点都有2 2个儿子结点。个儿子结点。平均码长平均码长定义为:定义为:使平均码长达到最小的前缀码编码方案称为给定编码字符集使平均码长达到最小的前缀码编码方案称为给定编码字符集C C的的最优前缀码最优前缀码。2023/2/2324现在学习的是第24页,共58页哈夫曼编码哈夫曼编码2 2、构造哈夫曼编码、构造哈夫曼编码
26、哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为案称为哈夫曼编码哈夫曼编码。哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树树T T。算法以算法以|C|C|个叶结点开始,执行个叶结点开始,执行|C|C|1 1次的次的“合并合并”运算后产运算后产生最终所要求的树生最终所要求的树T T。2023/2/2325现在学习的是第25页,共58页哈夫曼编码哈夫曼编码 在书上给出的算法在书上给出的算法huffmanTreehuffmanTree中,编码字符集中每一字符中,编码字符集中每一字符c
27、 c的频率是的频率是f(c)f(c)。以以f f为键值的优先队列为键值的优先队列Q Q用在用在贪心选择贪心选择时有效地确定算时有效地确定算法当前要合并的法当前要合并的2 2棵具有最小频率的树。一旦棵具有最小频率的树。一旦2 2棵具有最小频率的树合并后,棵具有最小频率的树合并后,产生一棵新的树,其频率为合并的产生一棵新的树,其频率为合并的2 2棵树的频率之和,并将新树插入优先棵树的频率之和,并将新树插入优先队列队列Q Q。经过。经过n n1 1次的合并后,优先队列中只剩下一棵树,即所要求的树次的合并后,优先队列中只剩下一棵树,即所要求的树T T。算法算法huffmanTreehuffmanTre
28、e用最小堆实现优先队列用最小堆实现优先队列Q Q。初始化优先队列需。初始化优先队列需要要O(n)O(n)计算时间,由于最小堆的计算时间,由于最小堆的removeMinremoveMin和和putput运算均需运算均需O(logn)O(logn)时间,时间,n n1 1次的合并总共需要次的合并总共需要O(nlogn)O(nlogn)计算时间。因此,关于计算时间。因此,关于n n个个字符的哈夫曼算法的字符的哈夫曼算法的计算时间计算时间为为O(nlogn)O(nlogn)。2023/2/2326现在学习的是第26页,共58页哈夫曼编码哈夫曼编码3 3、哈夫曼算法的正确性、哈夫曼算法的正确性要证明哈夫
29、曼算法的正确性,只要证明最优前要证明哈夫曼算法的正确性,只要证明最优前缀码问题具有缀码问题具有贪心选择性质贪心选择性质和和最优子结构性质最优子结构性质。(1)(1)贪心选择性质贪心选择性质(2)(2)最优子结构性质最优子结构性质2023/2/2327现在学习的是第27页,共58页单源最短路径单源最短路径给定带权有向图给定带权有向图G=(V,E)G=(V,E),其中每条边的权是非负实数。另外,其中每条边的权是非负实数。另外,还给定还给定V V中的一个顶点,称为中的一个顶点,称为源源。现在要计算从源到所有其它各顶点。现在要计算从源到所有其它各顶点的的最短路长度最短路长度。这里路的长度是指路上各边权
30、之和。这个问题。这里路的长度是指路上各边权之和。这个问题通常称为通常称为单源最短路径问题单源最短路径问题。1 1、算法基本思想、算法基本思想DijkstraDijkstra算法是解单源最短路径问题的贪心算法。算法是解单源最短路径问题的贪心算法。2023/2/2328现在学习的是第28页,共58页单源最短路径单源最短路径其其基本思想基本思想是,设置顶点集合是,设置顶点集合S S并不断地作并不断地作贪心选择贪心选择来扩充这个来扩充这个集合。一个顶点属于集合集合。一个顶点属于集合S S当且仅当从源到该顶点的最短路径长当且仅当从源到该顶点的最短路径长度已知。度已知。初始时,初始时,S S中仅含有源。设
31、中仅含有源。设u u是是G G的某一个顶点,把从源到的某一个顶点,把从源到u u且中间且中间只经过只经过S S中顶点的路称为从源到中顶点的路称为从源到u u的特殊路径,并用数组的特殊路径,并用数组distdist记录当前每记录当前每个顶点所对应的最短特殊路径长度。个顶点所对应的最短特殊路径长度。DijkstraDijkstra算法每次从算法每次从V-SV-S中取出具中取出具有最短特殊路长度的顶点有最短特殊路长度的顶点u u,将,将u u添加到添加到S S中,同时对数组中,同时对数组distdist作必要的作必要的修改。一旦修改。一旦S S包含了所有包含了所有V V中顶点,中顶点,distdis
32、t就记录了从源到所有其它顶点之就记录了从源到所有其它顶点之间的最短路径长度。间的最短路径长度。2023/2/2329现在学习的是第29页,共58页单源最短路径单源最短路径例如例如,对右图中的有,对右图中的有向图,应用向图,应用DijkstraDijkstra算法算法计算从源顶点计算从源顶点1 1到其它顶到其它顶点间最短路径的过程列在点间最短路径的过程列在下页的表中。下页的表中。2023/2/2330现在学习的是第30页,共58页单源最短路径单源最短路径迭代迭代S Su udist2dist2dist3dist3dist4dist4dist5dist5初始初始11-1010maxintmaxin
33、t30301001001 11,21,22 21010606030301001002 21,2,41,2,44 410105050303090903 31,2,4,31,2,4,33 310105050303060604 41,2,4,3,51,2,4,3,55 51010505030306060DijkstraDijkstra算法的迭代过程:算法的迭代过程:2023/2/2331现在学习的是第31页,共58页单源最短路径单源最短路径2 2、算法的正确性和计算复杂性、算法的正确性和计算复杂性(1)(1)贪心选择性质贪心选择性质(2)(2)最优子结构性质最优子结构性质(3)(3)计算复杂性计算复
34、杂性对于具有对于具有n n个顶点和个顶点和e e条边的带权有向图,如果用带权邻接矩阵表示这条边的带权有向图,如果用带权邻接矩阵表示这个图,那么个图,那么DijkstraDijkstra算法的主循环体需要算法的主循环体需要 时间。这个循环需要执行时间。这个循环需要执行n-1n-1次,所以完成循环需要次,所以完成循环需要 时间。算法的其余部分所需要时间不超过时间。算法的其余部分所需要时间不超过 。2023/2/2332现在学习的是第32页,共58页最小生成树最小生成树 设设G=(V,E)G=(V,E)是无向连通带权图,即一个是无向连通带权图,即一个网络网络。E E中每条边中每条边(v,w)(v,w
35、)的权为的权为cvwcvw。如果。如果G G的子图的子图G G是一棵包含是一棵包含G G的所有顶点的所有顶点的树,则称的树,则称G G为为G G的生成树。生成树上各边权的总和称为该生成的生成树。生成树上各边权的总和称为该生成树的树的耗费耗费。在。在G G的所有生成树中,耗费最小的生成树称为的所有生成树中,耗费最小的生成树称为G G的的最最小生成树小生成树。网络的最小生成树在实际中有广泛应用。网络的最小生成树在实际中有广泛应用。例如例如,在设计通信,在设计通信网络时,用图的顶点表示城市,用边网络时,用图的顶点表示城市,用边(v,w)(v,w)的权的权cvwcvw表示建立城表示建立城市市v v和城
36、市和城市w w之间的通信线路所需的费用,则最小生成树就给出了建之间的通信线路所需的费用,则最小生成树就给出了建立通信网络的最经济的方案。立通信网络的最经济的方案。2023/2/2333现在学习的是第33页,共58页最小生成树最小生成树1 1、最小生成树性质、最小生成树性质用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节介绍的构造最小生成树的介绍的构造最小生成树的PrimPrim算法算法和和KruskalKruskal算法算法都可以看作是应用贪心算都可以看作是应用贪心算法设计策略的例子。尽管这法设计策略的例子。尽管这2 2个算法
37、做贪心选择的方式不同,它们都利用了个算法做贪心选择的方式不同,它们都利用了下面的下面的最小生成树性质最小生成树性质:设设G=(V,E)G=(V,E)是连通带权图,是连通带权图,U U是是V V的真子集。如果的真子集。如果(u,v)(u,v)E E,且,且u u U U,v v V-V-U U,且在所有这样的边中,且在所有这样的边中,(u,v)(u,v)的权的权cuvcuv最小,那么一定存在最小,那么一定存在G G的一的一棵最小生成树,它以棵最小生成树,它以(u,v)(u,v)为其中一条边。这个性质有时也称为为其中一条边。这个性质有时也称为MSTMST性质性质。2023/2/2334现在学习的是
38、第34页,共58页最小生成树最小生成树2 2、PrimPrim算法算法 设设G=(V,E)G=(V,E)是连通带权图,是连通带权图,V=1,2,V=1,2,n,n。构造构造G G的最小生成树的的最小生成树的PrimPrim算法的算法的基本思想基本思想是:首先置是:首先置S=1S=1,然后,只要,然后,只要S S是是V V的真子集,就作如下的的真子集,就作如下的贪心选择:贪心选择:选取满足条选取满足条件件i i S S,j j V-SV-S,且,且cijcij最小的边,将顶点最小的边,将顶点j j添加到添加到S S中。这个过中。这个过程一直进行到程一直进行到S=VS=V时为止。时为止。在这个过程
39、中选取到的所有边恰好构成在这个过程中选取到的所有边恰好构成G G的一棵的一棵最小生成树。最小生成树。2023/2/2335现在学习的是第35页,共58页最小生成树最小生成树利用最小生成树性质利用最小生成树性质和数学归纳法容易证明,和数学归纳法容易证明,上述算法中的上述算法中的边集合边集合T T始终始终包含包含G G的某棵最小生成树中的某棵最小生成树中的边。的边。因此,在算法结束因此,在算法结束时,时,T T中的所有边构成中的所有边构成G G的的一棵最小生成树。一棵最小生成树。例如例如,对于右图中的,对于右图中的带权图,按带权图,按PrimPrim算法算法选取选取边的过程如下页图所示。边的过程如
40、下页图所示。2023/2/2336现在学习的是第36页,共58页最小生成树最小生成树2023/2/2337现在学习的是第37页,共58页最小生成树最小生成树在上述在上述PrimPrim算法中,还应当考虑算法中,还应当考虑如何有效地找出满足条件如何有效地找出满足条件i i S,jS,j V-SV-S,且权,且权cijcij最小的边最小的边(i,j)(i,j)。实现这个目的的较实现这个目的的较简单的办法是设置简单的办法是设置2 2个数组个数组closestclosest和和lowcostlowcost。在在PrimPrim算法执行过程中,先找出算法执行过程中,先找出V-SV-S中使中使lowcos
41、tlowcost值最小的顶值最小的顶点点j j,然后根据数组,然后根据数组closestclosest选取边选取边(j,closestj(j,closestj),最后将,最后将j j添加添加到到S S中,并对中,并对closestclosest和和lowcostlowcost作必要的修改。作必要的修改。用这个办法实现的用这个办法实现的PrimPrim算法所需的算法所需的计算时间计算时间为为 2023/2/2338现在学习的是第38页,共58页最小生成树最小生成树3 3、KruskalKruskal算法算法KruskalKruskal算法构造算法构造G G的最小生成树的的最小生成树的基本思想基本
42、思想是,首先将是,首先将G G的的n n个顶点看成个顶点看成n n个孤立的连通分支。将所有的边按权从小到大排序。个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接述方法连接2 2个不同的连通分支:当查看到第个不同的连通分支:当查看到第k k条边条边(v,w)(v,w)时,如时,如果端点果端点v v和和w w分别是当前分别是当前2 2个不同的连通分支个不同的连通分支T1T1和和T2T2中的顶点时,中的顶点时,就用边就用边(v,w)(v,w)将将T1T1和和T2T2连接成一个连通分
43、支,然后继续查看第连接成一个连通分支,然后继续查看第k+1k+1条边;如果端点条边;如果端点v v和和w w在当前的同一个连通分支中,就直接再查看在当前的同一个连通分支中,就直接再查看第第k+1k+1条边。这个过程一直进行到只剩下一个连通分支时为止。条边。这个过程一直进行到只剩下一个连通分支时为止。2023/2/2339现在学习的是第39页,共58页最小生成树最小生成树例如,例如,对前面的连通带权图,按对前面的连通带权图,按KruskalKruskal算法顺序得到的最小算法顺序得到的最小生成树上的边如下图所示。生成树上的边如下图所示。2023/2/2340现在学习的是第40页,共58页最小生成
44、树最小生成树关于关于集合的一些基本运算集合的一些基本运算可用于实现可用于实现KruskalKruskal算法。算法。按权的递增顺序查看等价于对按权的递增顺序查看等价于对优先队列优先队列执行执行removeMinremoveMin运运算。可以用算。可以用堆堆实现这个优先队列。实现这个优先队列。对一个由连通分支组成的集合不断进行修改,需要用到抽象对一个由连通分支组成的集合不断进行修改,需要用到抽象数据类型数据类型并查集并查集UnionFindUnionFind所支持的基本运算。所支持的基本运算。当图的边数为当图的边数为e e时,时,KruskalKruskal算法所需的算法所需的计算时间计算时间是
45、是 。当。当 时,时,KruskalKruskal算法比算法比PrimPrim算法差,但当算法差,但当 时,时,KruskalKruskal算法却比算法却比PrimPrim算法好得多。算法好得多。2023/2/2341现在学习的是第41页,共58页多机调度问题多机调度问题多机调度问题多机调度问题要求给出一种作业调度方案,使所给的要求给出一种作业调度方案,使所给的n n个作业个作业在尽可能短的时间内由在尽可能短的时间内由m m台机器加工处理完成。台机器加工处理完成。这个问题是这个问题是NPNP完全问题完全问题,到目前为止还没有有效的解法。对于,到目前为止还没有有效的解法。对于这一类问题这一类问题
46、,用用贪心选择策略贪心选择策略有时可以设计出较好的近似算法。有时可以设计出较好的近似算法。约定,每个作业均可在任何一台机器上加工处理,但未完工约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能拆分成更小的子作业。前不允许中断处理。作业不能拆分成更小的子作业。2023/2/2342现在学习的是第42页,共58页多机调度问题多机调度问题采用采用最长处理时间作业优先最长处理时间作业优先的贪心选择策略可以设计出解多机调的贪心选择策略可以设计出解多机调度问题的较好的近似算法。度问题的较好的近似算法。按此策略,当按此策略,当 时,只要将机器时,只要将机器i i的的0,ti0,t
47、i时间区间分时间区间分配给作业配给作业i i即可,算法只需要即可,算法只需要O(1)O(1)时间。时间。当当 时,首先将时,首先将n n个作业依其所需的处理时间从大到小个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算时间为时间为O(nlogn)O(nlogn)。2023/2/2343现在学习的是第43页,共58页多机调度问题多机调度问题例如,例如,设设7 7个独立作业个独立作业1,2,3,4,5,6,71,2,3,4,5,6,7由由3 3台机器台机器M1M1,M2M2和和M3M3加工处理。各作业
48、所需的处理时间分别为加工处理。各作业所需的处理时间分别为2,14,4,16,6,5,32,14,4,16,6,5,3。按算法。按算法greedygreedy产生的作业调度如下产生的作业调度如下图所示,所需的加工时间为图所示,所需的加工时间为1717。2023/2/2344现在学习的是第44页,共58页贪心算法的理论基础贪心算法的理论基础借助于借助于拟阵拟阵工具,可建立关于贪心算法的较一般的理论。这工具,可建立关于贪心算法的较一般的理论。这个理论对个理论对确定何时使用贪心算法确定何时使用贪心算法可以得到问题的整体最优解可以得到问题的整体最优解十分有用。十分有用。1 1、拟阵、拟阵拟阵拟阵M M定
49、义为满足下面定义为满足下面3 3个条件的有序对个条件的有序对(S,I)(S,I):(1)S(1)S是非空有限集。是非空有限集。(2)I(2)I是是S S的一类具有遗传性质的独立子集族,即若的一类具有遗传性质的独立子集族,即若B B I I,则,则B B是是S S的的独立子集,且独立子集,且B B的任意子集也都是的任意子集也都是S S的独立子集。空集的独立子集。空集必为必为I I的成员。的成员。(3)I(3)I满足交换性质,即若满足交换性质,即若A A I,BI,B I I且且|A|B|A|0W(x)0,则称拟阵,则称拟阵M M为为带权拟阵带权拟阵。依此权函数,。依此权函数,S S的任一子集的任
50、一子集A A的的权定义为权定义为 。2 2、关于带权拟阵的贪心算法、关于带权拟阵的贪心算法许多可以用贪心算法求解的问题可以表示为求带权拟阵的许多可以用贪心算法求解的问题可以表示为求带权拟阵的最最大权独立子集问题。大权独立子集问题。2023/2/2347现在学习的是第47页,共58页贪心算法的理论基础贪心算法的理论基础给定带权拟阵给定带权拟阵M=(S,I)M=(S,I),确定,确定S S的独立子集的独立子集A A I I使得使得W(A)W(A)达到最大。达到最大。这种使这种使W(A)W(A)最大的独立子集最大的独立子集A A称为拟阵称为拟阵M M的的最优子集最优子集。由于。由于S S中任中任一元