第4章-贪心算法--计算机算法设计与分析(第3版)-教学课件.ppt

上传人:知****量 文档编号:73605812 上传时间:2023-02-20 格式:PPT 页数:59 大小:1.70MB
返回 下载 相关 举报
第4章-贪心算法--计算机算法设计与分析(第3版)-教学课件.ppt_第1页
第1页 / 共59页
第4章-贪心算法--计算机算法设计与分析(第3版)-教学课件.ppt_第2页
第2页 / 共59页
点击查看更多>>
资源描述

《第4章-贪心算法--计算机算法设计与分析(第3版)-教学课件.ppt》由会员分享,可在线阅读,更多相关《第4章-贪心算法--计算机算法设计与分析(第3版)-教学课件.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第4章 贪心算法1学习要点学习要点理解贪心算法的概念。掌握贪心算法的基本要素(1)最优子结构性质(2)贪心选择性质理解贪心算法与动态规划算法的差异理解贪心算法的一般理论通过应用范例学习贪心设计策略。(1)活动安排问题;(2)最优装载问题;(3)哈夫曼编码;(4)单源最短路径;(5)最小生成树;(6)多机调度问题。2 顾名思义,贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优局部最优选择。当然,希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,

2、最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。34.1 活动安排问题 活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。44.1 活动安排问题ntemplatenvoid GreedySelector(int n,Type s,Type f,bool A)nn A1=true;n int j=1;n for(int i=2;i=fj)Ai=true;j=i;n else Ai

3、=false;n n下面给出解活动安排问题的贪心算法GreedySelectorGreedySelector:各活动的起始时间和结各活动的起始时间和结束时间存储于数组束时间存储于数组s s和和f f中且按结束时间的非减中且按结束时间的非减序排列序排列 64.1 活动安排问题 由于输入的活动以其完成时间的非减序非减序排列,所以算法greedySelectorgreedySelector每次总是选择具有最早具有最早完成时间完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化使剩余的可安排时间段极大

4、化,以便安排尽可能多的相容活动。算法greedySelectorgreedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)O(nlogn)的时间重排。74.1 活动安排问题 例:例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:i1234567891011Si130535688212fi45678910 11 12 13 1484.1 活动安排问题 若被检查的活动i的开始时间Si小于最近选择的活动j的结束时间fi,则不选择

5、活动i,否则选择活动i加入集合A中。贪心算法并不总能求得问题的整体最优解整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。104.2 贪心算法的基本要素 本节着重讨论可以用贪心算法求解的问题的一般特征。对于一个具体的问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有2个重要的性质:贪心选择性质贪心选择性质和最最优子结构性质优子结构性质。114.2 贪心算法的基本要素 当一个问题的

6、最优解包含其子问题的最优解时,称此问题具有最优子结构性质最优子结构性质。问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。2 2、最优子结构性质、最优子结构性质134.2 贪心算法的基本要素n0-10-1背包问题:背包问题:给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?在选择装入背包的物品时,对每种物品在选择装入背包的物品时,对每种物品i i只有只有2 2种选择,即种选择,即装入背包或不装入背包。不能将物品装入背包或不装入背包。不能将物品i i装入背包多次,也不能只装入背包多次,也不能只装

7、入部分的物品装入部分的物品i i。154.2 贪心算法的基本要素n背包问题:背包问题:与0-1背包问题类似,所不同的是在选择物品i装入背包时,可以选择物品可以选择物品i i的一部分的一部分,而不一定要全部装入背包,1in。这2类问题都具有最优子结构最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。164.2 贪心算法的基本要素nvoid Knapsack(int n,float M,float v,float w,float x)nn Sort(n,v,w);n int i;n for(i=1;i=n;i+)xi=0;n float c=M;n fo

8、r(i=1;ic)break;n xi=1;n c-=wi;n n if(i=n)xi=c/wi;n 算法算法knapsackknapsack的的主要计算时间在于将主要计算时间在于将各种物品依其单位重各种物品依其单位重量的价值从大到小排量的价值从大到小排序。因此,算法的计序。因此,算法的计算时间上界为算时间上界为O O(nlognnlogn)。)。为了证明算法的正确为了证明算法的正确性,还必须证明背包性,还必须证明背包问题具有贪心选择性问题具有贪心选择性质质。184.2 贪心算法的基本要素 对于0-10-1背包问题背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包

9、装满,部分闲置的背包空间使每公斤背包空间的价值降低了。事实上,在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划动态规划算法算法求解的另一重要特征。实际上也是如此,动态规划算法的确可以有效地解0-1背包问题。194.3 最优装载 有一批集装箱要装上一艘载重量为c的轮船。其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。1 1、算法描述、算法描述最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可产生最优装载问题的最优解。具体算法描述

10、如下页。204.3 最优装载ntemplatenvoid Loading(int x,Type w,Type c,int n)nn int*t=new int n+1;n Sort(w,t,n);n for(int i=1;i=n;i+)xi=0;n for(int i=1;i=n&wti=c;i+)xti=1;c-=wti;n214.3 最优装载2 2、贪心选择性质、贪心选择性质 可以证明最优装载问题具有贪心选择性质。3 3、最优子结构性质、最优子结构性质最优装载问题具有最优子结构性质。由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法loadingloading的正确性。算法loa

11、dingloading的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为 O(nlogn)O(nlogn)。224.4 哈夫曼编码 编码的前缀性质可以使译码方法非常简单。表示最优前缀码最优前缀码的二叉树总是一棵完全二叉树完全二叉树,即树中任一结点都有2个儿子结点。平均码长平均码长定义为:使平均码长达到最小的前缀码编码方案称为给定编码字符集C的最优前缀码最优前缀码。244.4 哈夫曼编码2 2、构造哈夫曼编码、构造哈夫曼编码哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为哈夫曼编码哈夫曼编码。哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树T。算法以|C|个叶结点

12、开始,执行|C|1次的“合并”运算后产生最终所要求的树T。254.4 哈夫曼编码 在书上给出的算法huffmanTree中,编码字符集中每一字符c的频率是f(c)。以以f f为键值的优先队列为键值的优先队列Q Q用在贪心选择贪心选择时有效地确定算法当前要合并的2棵具有最小频率的树。一旦2棵具有最小频率的树合并后,产生一棵新的树,其频率为合并的2棵树的频率之和,并将新树插入优先队列Q。经过n1次的合并后,优先队列中只剩下一棵树,即所要求的树T。算法huffmanTree用最小堆实现优先队列Q。初始化优先队列需要O(n)计算时间,由于最小堆的removeMin和put运算均需O(logn)时间,n

13、1次的合并总共需要O(nlogn)计算时间。因此,关于n个字符的哈夫曼算法的计算时间计算时间为O(nlogn)。264.5 单源最短路径给定带权有向图G=(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源源。现在要计算从源到所有其它各顶点的最短路长度最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源单源最短路径问题最短路径问题。1、算法基本思想Dijkstra算法是解单源最短路径问题的贪心算法。284.5 单源最短路径其基本思想基本思想是,设置顶点集合S并不断地作贪心选贪心选择择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。初始时

14、,S中仅含有源。设u是G的某一个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。一旦S包含了所有V中顶点,dist就记录了从源到所有其它顶点之间的最短路径长度。294.5 单源最短路径迭代迭代S Su udist2dist2 dist3dist3 dist4dist4 dist5dist5 初始初始1-10maxint301001 11,221060301002 21,2,44105030903 31,2,4

15、,33105030604 41,2,4,3,5510503060Dijkstra算法的迭代过程:314.5 单源最短路径2、算法的正确性和计算复杂性(1)贪心选择性质(2)最优子结构性质(3)计算复杂性对于具有n个顶点和e条边的带权有向图,如果用带权邻接矩阵表示这个图,那么Dijkstra算法的主循环体需要 时间。这个循环需要执行n-1次,所以完成循环需要 时间。算法的其余部分所需要时间不超过 。324.6 最小生成树 设G=(V,E)是无向连通带权图,即一个网络网络。E中每条边(v,w)的权为cvw。如果G的子图G是一棵包含G的所有顶点的树,则称G为G的生成树。生成树上各边权的总和称为该生成

16、树的耗费耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树最小生成树。网络的最小生成树在实际中有广泛应用。例如例如,在设计通信网络时,用图的顶点表示城市,用边(v,w)的权cvw表示建立城市v和城市w之间的通信线路所需的费用,则最小生成树就给出了建立通信网络的最经济的方案。334.6 最小生成树1、最小生成树性质用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节介绍的构造最小生成树的PrimPrim算法算法和KruskalKruskal算法算法都可以看作是应用贪心算法设计策略的例子。尽管这2个算法做贪心选择的方式不同,它们都利用了下面的最小生成树性质最小生成树性质:设G=(V

17、,E)是连通带权图,U是V的真子集。如果(u,v)E,且uU,vV-U,且在所有这样的边中,(u,v)的权cuv最小,那么一定存在G的一棵最小生成树,它以(u,v)为其中一条边。这个性质有时也称为MSTMST性质性质。344.6 最小生成树2 2、PrimPrim算法算法 设G=(V,E)是连通带权图,V=1,2,n。构造G的最小生成树的Prim算法的基本思想基本思想是:首先置S=1,然后,只要S是V的真子集,就作如下的贪贪心选择心选择:选取满足条件iS,jV-S,且cij最小的边,将顶点j添加到S中。这个过程一直进行到S=V时为止。在这个过程中选取到的所有边恰好构成G的一棵最最小生成树小生成

18、树。354.6 最小生成树利用最小生成树性质和数学归纳法容易证明,上述算法中的边集合边集合T T始终始终包含包含G G的某棵最小生成树中的某棵最小生成树中的边的边。因此,在算法结束时,T中的所有边构成G的一棵最小生成树。例如例如,对于右图中的带权图,按PrimPrim算法算法选取边的过程如下页图所示。364.6 最小生成树374.6 最小生成树在上述Prim算法中,还应当考虑如何有效地找出如何有效地找出满足条件满足条件i i S,jS,j V-SV-S,且权,且权cijcij最小的边最小的边(i,j)(i,j)。实现这个目的的较简单的办法是设置2个数组closest和lowcost。在Prim

19、算法执行过程中,先找出V-S中使lowcost值最小的顶点j,然后根据数组closest选取边(j,closestj),最后将j添加到S中,并对closest和lowcost作必要的修改。用这个办法实现的Prim算法所需的计算时间计算时间为 384.6 最小生成树3 3、KruskalKruskal算法算法Kruskal算法构造G的最小生成树的基本思想基本思想是,首先将G的n个顶点看成n个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接2个不同的连通分支:当查看到第k条边(v,w)时,如果端点v和w分别是当前2个不同的连通分支T1和

20、T2中的顶点时,就用边(v,w)将T1和T2连接成一个连通分支,然后继续查看第k+1条边;如果端点v和w在当前的同一个连通分支中,就直接再查看第k+1条边。这个过程一直进行到只剩下一个连通分支时为止。394.6 最小生成树例如,例如,对前面的连通带权图,按Kruskal算法顺序得到的最小生成树上的边如下图所示。404.6 最小生成树关于集合的一些基本运算集合的一些基本运算可用于实现Kruskal算法。按权的递增顺序查看等价于对优先队列优先队列执行removeMinremoveMin运算。可以用堆堆实现这个优先队列。对一个由连通分支组成的集合不断进行修改,需要用到抽象数据类型并查集并查集Unio

21、nFindUnionFind所支持的基本运算。当图的边数为e时,Kruskal算法所需的计算时间计算时间是 。当 时,Kruskal算法比Prim算法差,但当 时,Kruskal算法却比Prim算法好得多。414.7 多机调度问题多机调度问题多机调度问题要求给出一种作业调度方案,使所给的n个作业在尽可能短的时间内由m台机器加工处理完成。这个问题是NPNP完全问题完全问题,到目前为止还没有有效的解法。对于这一类问题,用贪心选择策略贪心选择策略有时可以设计出较好的近似算法。约定,每个作业均可在任何一台机器上加工处理,但未约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能

22、拆分成更小的子作业。完工前不允许中断处理。作业不能拆分成更小的子作业。424.7 多机调度问题采用最长处理时间作业优先最长处理时间作业优先的贪心选择策略可以设计出解多机调度问题的较好的近似算法。按此策略,当 时,只要将机器i的0,ti时间区间分配给作业i即可,算法只需要O(1)时间。当 时,首先将n个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算时间为O(nlogn)。434.7 多机调度问题例如,例如,设7个独立作业1,2,3,4,5,6,7由3台机器M1,M2和M3加工处理。各作业所需的处理时间分别为2,14,4,16,6,5,3。按算法greed

23、ygreedy产生的作业调度如下图所示,所需的加工时间为17。444.8 贪心算法的理论基础借助于拟阵拟阵工具,可建立关于贪心算法的较一般的理论。这个理论对确定何时使用贪心算法确定何时使用贪心算法可以得到问题的整体最优解十分有用。1 1、拟阵、拟阵拟阵M定义为满足下面3个条件的有序对(S,I):(1)S是非空有限集。(2)I是S的一类具有遗传性质的独立子集族,即若BI,则B是S的独立子集,且B的任意子集也都是S的独立子集。空集必为I的成员。(3)I满足交换性质,即若AI,BI且|A|0,则称拟阵M为带权拟阵带权拟阵。依此权函数,S的任一子集A的权定义为 。2 2、关于带权拟阵的贪心算法、关于带

24、权拟阵的贪心算法许多可以用贪心算法求解的问题可以表示为求带权拟阵的最大权独立子集问题最大权独立子集问题。474.8 贪心算法的理论基础给定带权拟阵M=(S,I),确定S的独立子集AI使得W(A)达到最大。这种使W(A)最大的独立子集A称为拟阵M的最优子集最优子集。由于S中任一元素x的权W(x)是正的,因此,最优子集也一定是极大独立子集最优子集也一定是极大独立子集。例如,例如,在最小生成树问题可以表示为确定带权拟阵 的最优子集问题。求带权拟阵的最优子集A的算法可用于解最小生成树问题。下面给出求带权拟阵最优子集带权拟阵最优子集的贪心算法。该算法以具有正权函数W的带权拟阵M=(S,I)作为输入,经计

25、算后输出M的最优子集A。484.8 贪心算法的理论基础nSet greedygreedy(M,W)nA=;n 将S中元素依权值W(大者优先)组成优先队列;n while(S!=)n S.removeMax(x);n if(AxI)A=Ax;n n return An494.8 贪心算法的理论基础算法greedygreedy的计算时间复杂性为 。引理引理4.24.2(拟阵的贪心选择性质拟阵的贪心选择性质)设M=(S,I)是具有权函数W的带权拟阵,且S中元素依权值从大到小排列。又设x S是S中第一个使得x是独立子集的元素,则存在S的最优子集A使得x A。算法greedygreedy在以贪心选择构造

26、最优子集A时,首次选入集合A中的元素x是单元素独立集中具有最大权的元素。此时可能已经舍弃了S中部分元素。可以证明这些被舍弃的元素不可能用于构造最优子集。504.8 贪心算法的理论基础引理引理4.34.3:设M=(S,I)是拟阵。若S中元素x不是空集的可扩展元素,则x也不可能是S中任一独立子集A的可扩展元素。引理引理4.4(4.4(拟阵的最优子结构性质拟阵的最优子结构性质)设x是求带权拟阵M(S,I)的最优子集的贪心算法greedygreedy所选择的S中的第一个元素。那么,原问题可简化为求带权拟阵M=(S,I)的最优子集最优子集问题,其中:S=y|y S且x,y II=B|B S-x且Bx I

27、M的权函数是M的权函数在S上的限制(称M为M关于元素x的收缩收缩)。514.8 贪心算法的理论基础定理定理4.5(4.5(带权拟阵贪心算法的正确性带权拟阵贪心算法的正确性)设M(S,I)是具有权函数W的带权拟阵,算法greedy返回M的最优子集。3 3、任务时间表问题、任务时间表问题给定一个单位时间任务单位时间任务的有限集S。关于S的一个时间表时间表用于描述S中单位时间任务的执行次序。时间表中第1个任务从时间0开始执行直至时间1结束,第2个任务从时间1开始执行至时间2结束,第n个任务从时间n-1开始执行直至时间n结束。524.8 贪心算法的理论基础具有截止时间截止时间和误时惩罚误时惩罚的单位时

28、间任务时间表问题可描述如下。(1)n个单位时间任务的集合S=1,2,n;(2)任务i的截止时间 ,1in,1 n,即要求任务i在时间 之前结束;(3)任务i的误时惩罚 ,1in,即任务i未在时间 之前结束将招致的 惩罚;若按时完成则无惩罚。任务时间表问题任务时间表问题要求确定S的一个时间表(最优时间表)使得总误时惩罚达到最小。534.8 贪心算法的理论基础这个问题看上去很复杂,然而借助于拟阵拟阵,可以用带权拟阵的贪心算法带权拟阵的贪心算法有效求解。对于一个给定的S的时间表,在截止时间之前完成的任务称为及时任务及时任务,在截止时间之后完成的任务称为误时任务误时任务。S的任一时间表可以调整成及时优

29、先形式及时优先形式,即其中所有及时任务先于误时任务,而不影响原时间表中各任务的及时或误时性质。类似地,还可将S的任一时间表调整成为规范形式规范形式,其中及时任务先于误时任务,且及时任务依其截止时间的非减序排列。544.8 贪心算法的理论基础首先可将时间表调整为及时优先形式,然后再进一步调整及时任务的次序。任务时间表问题等价于等价于确定最优时间表中及时任及时任务子集务子集A A的问题。一旦确定了及时任务子集A,将A中各任务依其截止时间的非减序列出,然后再以任意次序列出误时任务,即S-A中各任务,由此产生S的一个规范的最优时间表。对时间t=1,2,n,设设 (A)是任务子集A中所有截止时间是t或更

30、早的任务数。考察任务子集A的独立性。554.8 贪心算法的理论基础引理引理4.64.6:对于S的任一任务子集A,下面的各命题是等价的。(1)任务子集A是独立子集。(2)对于t=1,2,n,(A)t。(3)若A中任务依其截止时间非减序排列,则A中所有任务都是及时的。任务时间表问题任务时间表问题要求使总误时惩罚达到最小,这等价于使任务时间表中的及时任务的惩罚值之和达到最大。下面的定理定理表明可用带权拟阵的贪心算法解任务时间表问题。564.8 贪心算法的理论基础定理定理4.74.7:设S是带有截止时间的单位时间任务集,I是S的所有独立任务子集构成的集合。则有序对(S,I)是拟阵。由定理定理4.54.

31、5可知,用带权拟阵的贪心算法可以求得最大权(惩罚)独立任务子集A,以A作为最优时间表中的及时任务子集,容易构造最优时间表。任务时间表问题的贪心算法的计算时间复杂性计算时间复杂性是 。其中f(n)是用于检测任务子集A的独立性所需的时间。用引理4.6中性质(2)容易设计一个 时间算法来检测任务子集的独立性。因此,整个算法的计算时间计算时间为 。具体算法greedyJobgreedyJob可描述如P130。574.8 贪心算法的理论基础用抽象数据类型并查集UnionFindUnionFind可对上述算法作进一步改进。如果不计预处理的时间,改进后的算法fasterJobfasterJob所需的计算时间计算时间为 。5859

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁