《动态规划方法讲稿.ppt》由会员分享,可在线阅读,更多相关《动态规划方法讲稿.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、动态规划方法动态规划方法2023/4/11第一页,讲稿共三十九页哦 动态规划动态规划(Dynamic Programming)同前面介绍)同前面介绍过的线性规划方法不同,它不是一种算法,而是考察问过的线性规划方法不同,它不是一种算法,而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的题的一种途径。动态规划是一种求解多阶段决策问题的系统技术。由于动态规划不是一种特定的算法,因而它系统技术。由于动态规划不是一种特定的算法,因而它不像线性规划那样有一个标准的数学表达式和明确定义不像线性规划那样有一个标准的数学表达式和明确定义的一组规则,动态规划必须对具体问题进行具体的分析的一组规则,动态规划
2、必须对具体问题进行具体的分析处理。动态规划在自然科学和社会科学等各个领域都有处理。动态规划在自然科学和社会科学等各个领域都有着广泛的应用,并且获得了显著的效果。着广泛的应用,并且获得了显著的效果。2023/4/12第二页,讲稿共三十九页哦1 1 最短路径问题最短路径问题 2 2 贝尔曼最优化原理贝尔曼最优化原理 3 3 WinQSBinQSB软件应用软件应用动态规划动态规划2023/4/13第三页,讲稿共三十九页哦动态规划是解决多阶段决策问题动态规划是解决多阶段决策问题的一种方法的一种方法.1951年,美国数学年,美国数学家贝尔曼(家贝尔曼(R.Bellman,19201984)研究了一类多阶
3、段决策)研究了一类多阶段决策问题的特征,提出了解决这类问问题的特征,提出了解决这类问题的基本原理。在研究、解决了题的基本原理。在研究、解决了某些实际问题的基础上,他于某些实际问题的基础上,他于1957年出版了年出版了动态规划动态规划这一这一名著。本章将简要介绍动态规划名著。本章将简要介绍动态规划的思想方法及其应用。的思想方法及其应用。2023/4/14第四页,讲稿共三十九页哦动态规划解决问题的基本思路是:把整体比较复动态规划解决问题的基本思路是:把整体比较复杂的大问题划分成一系列较易于解决的小问题,通过逐杂的大问题划分成一系列较易于解决的小问题,通过逐个求解,最终取得整体最优解。这种个求解,最
4、终取得整体最优解。这种“分而治之,逐步分而治之,逐步调整调整”的方法,在一些比较难以解决的复杂问题中已经的方法,在一些比较难以解决的复杂问题中已经显示出优越性。显示出优越性。2023/4/15第五页,讲稿共三十九页哦所谓多阶段决策过程是指这样一类活所谓多阶段决策过程是指这样一类活动过程:一个决策过程可以分为若干个相动过程:一个决策过程可以分为若干个相互联系的阶段,每个阶段都需要作一定的互联系的阶段,每个阶段都需要作一定的决策,但是每个阶段最优决策的选择不能决策,但是每个阶段最优决策的选择不能只是孤立地考虑本阶段所取得的效果如何,只是孤立地考虑本阶段所取得的效果如何,必须把整个过程中的各个阶段联
5、系起来考必须把整个过程中的各个阶段联系起来考虑,要求所选择的各个阶段决策的集合虑,要求所选择的各个阶段决策的集合策略,能使整个过程的总效果达到最优。策略,能使整个过程的总效果达到最优。2023/4/16第六页,讲稿共三十九页哦1 最短路径问题最短路径问题 2023/4/17第七页,讲稿共三十九页哦1 最短路径问题最短路径问题【例例1】设在设在E城的某公司要从城的某公司要从S城运送一批货城运送一批货物,两城之间有公路相连(见图物,两城之间有公路相连(见图 1(a)),其),其中中 是可以供选择的途经站点,各点连线上的数字是可以供选择的途经站点,各点连线上的数字表示相邻站点间的距离。现在的问题是选
6、择一表示相邻站点间的距离。现在的问题是选择一条由条由S到到E的路径,使得所经过的路径最短。的路径,使得所经过的路径最短。2023/4/18第八页,讲稿共三十九页哦1 最短路径问题最短路径问题(a)(b)2023/4/19第九页,讲稿共三十九页哦1 最短路径问题最短路径问题分析:如果用枚举法,将有分析:如果用枚举法,将有12条不同的路条不同的路径,每条路径对应一个由径,每条路径对应一个由S到到E的路径距离,的路径距离,其中最小值所对应的路径即为最短路径。本其中最小值所对应的路径即为最短路径。本问题的最短路径有问题的最短路径有3条,路程均为条,路程均为21个单位:个单位:第第1条:条:第第2条:条
7、:第第3条:条:2023/4/110第十页,讲稿共三十九页哦1 最短路径问题最短路径问题当段数很多时,枚举法的计算量将极其庞大。当段数很多时,枚举法的计算量将极其庞大。现在换个思路,寻找由现在换个思路,寻找由S到到E的最短路径。先的最短路径。先把最短路径问题所考虑的过程分为把最短路径问题所考虑的过程分为4个阶段:个阶段:由由S到到 为第为第1阶段;阶段;由由 到到 为第为第2阶段;阶段;由由 到到E为第为第4阶段。阶段。由由 到到 为第为第3阶段;阶段;2023/4/111第十一页,讲稿共三十九页哦1 最短路径问题最短路径问题我们称由某点到终点的阶段数我们称由某点到终点的阶段数k为为阶段变量阶
8、段变量,如由如由 到到E的阶段数为的阶段数为1(这时记由(这时记由C到到E的阶段数为的阶段数为1,它与第,它与第1阶段是不同的概念),阶段是不同的概念),由由 到到E的阶段数为的阶段数为2(这时记由(这时记由B到到E的阶段数为的阶段数为2),等等。可见阶段变量的取),等等。可见阶段变量的取值正好与实际进行的阶段相反(图(值正好与实际进行的阶段相反(图(b)。)。(b)2023/4/112第十二页,讲稿共三十九页哦1 最短路径问题最短路径问题在任一阶段开始时所处的位置称为在任一阶段开始时所处的位置称为状态变量状态变量,在阶段在阶段k的状态变量记为的状态变量记为 ,例如,例如 为阶为阶段段3的状态
9、变量,可以取为的状态变量,可以取为 中任中任意一个。意一个。当某一个状态给定后,需要做出决策以确定下一步当某一个状态给定后,需要做出决策以确定下一步的状态,描述决策的变量称为决策变量,在阶段的状态,描述决策的变量称为决策变量,在阶段k的决策变量记为的决策变量记为 。例如在阶段。例如在阶段2的状态取的状态取 时的决策变量记为时的决策变量记为 ,可取为可取为 。若若 ,则表示由,则表示由 到到 ,从而决定了下,从而决定了下一步的状态是一步的状态是 。2023/4/113第十三页,讲稿共三十九页哦1 最短路径问题最短路径问题为了寻找由起点为了寻找由起点S到到E终点的最短路径,我终点的最短路径,我们考
10、察前面用枚举法找到的第们考察前面用枚举法找到的第1条最短路径:条最短路径:容易看出:子路径容易看出:子路径“”也应是也应是从从 出发到终点出发到终点E的所有路径中最短的一条。的所有路径中最短的一条。这个现象启发我们从阶段这个现象启发我们从阶段1开始,逐段逆向地求出开始,逐段逆向地求出各点到终点各点到终点E的最短路径,最后求得由起点的最短路径,最后求得由起点S到终到终点点E的最短路径,这就是动态规划的基本思想。的最短路径,这就是动态规划的基本思想。2023/4/114第十四页,讲稿共三十九页哦1 最短路径问题最短路径问题 以以 表示在阶段表示在阶段k的状态变量为的状态变量为 、决策变量、决策变量
11、为为 时点时点 与与 间的距离;记间的距离;记 为在阶段为在阶段k由点由点 到终点到终点E的最短路径的长度。本例中要求的是的最短路径的长度。本例中要求的是 。在在阶段阶段1:可以取可以取 中任意一个,对应的有中任意一个,对应的有在在阶段阶段2:可以取可以取 中任意一个,对应的有中任意一个,对应的有2023/4/115第十五页,讲稿共三十九页哦1 最短路径问题最短路径问题从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量,决策变量 ;在在阶段阶段3:可以取可以取 中任意一个,中任意一个,对应的有对应的有从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量,决策变量 ;202
12、3/4/116第十六页,讲稿共三十九页哦1 最短路径问题最短路径问题从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量,决策变量 ;从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量决策变量 ;从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量决策变量 或或 ;最后,最后,在阶段在阶段4:只可以取只可以取S,于是,于是 2023/4/117第十七页,讲稿共三十九页哦1 最短路径问题最短路径问题因此,由起点因此,由起点S到终点到终点E的最短路径为的最短路径为最短路径长度为最短路径长度为21单位长度。单位长度。2023/4/118第十八页,讲稿共三十九页哦1 最
13、短路径问题最短路径问题由上述计算过程可知,对有由上述计算过程可知,对有n个阶段的最短个阶段的最短路径问题,可以逐段逆向地求出各点到终路径问题,可以逐段逆向地求出各点到终点的最短路径,且在求解的每一步都利用点的最短路径,且在求解的每一步都利用阶段阶段k和阶段和阶段k-1间的递推关系:间的递推关系:此关系被称为此关系被称为求最短路径的动态规划基本方程求最短路径的动态规划基本方程。求。求解最短路径问题的过程,本质上是解上述基本方解最短路径问题的过程,本质上是解上述基本方程的过程。程的过程。2023/4/119第十九页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理 2023/4/120第二十页
14、,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理 将求解最短路径问题的思路推广到一般多将求解最短路径问题的思路推广到一般多阶段决策问题时,可以表述成:阶段决策问题时,可以表述成:贝尔曼最优化原理:一个过程的最优策略贝尔曼最优化原理:一个过程的最优策略具有这样的性质,即无论其初始状态和初具有这样的性质,即无论其初始状态和初始决策如何,今后的诸决策,对以第一个始决策如何,今后的诸决策,对以第一个决策所形成的状态作为初始状态的过程而决策所形成的状态作为初始状态的过程而言,必须构成最优策略。言,必须构成最优策略。这个原理是动态规划的理论基础。这个原理是动态规划的理论基础。2023/4/121第二
15、十一页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理应用动态规划方法解决一般多阶段决策问题时,其求解过程应用动态规划方法解决一般多阶段决策问题时,其求解过程如下:如下:(1)把实际问题适当地划分成)把实际问题适当地划分成k个阶段,阶段变量为个阶段,阶段变量为 ;(2)在每个阶段)在每个阶段k,确定状态变量,确定状态变量 为及此阶段可能的为及此阶段可能的状态集合状态集合 ;(3)确定决策变量)确定决策变量 及每个阶段及每个阶段k的允许决策集合的允许决策集合 ;(4)列出递推关系即动态规划基本方程并计算:)列出递推关系即动态规划基本方程并计算:2023/4/122第二十二页,讲稿共三十九页
16、哦2 贝尔曼最优化原理贝尔曼最优化原理【例例2】(石油输送管道铺设优选问题)(石油输送管道铺设优选问题)某石某石油公司计划从油公司计划从A地到地到E地铺设一条石油输送管地铺设一条石油输送管道,为此在道,为此在A地与地与E地之间必须建立三个油泵地之间必须建立三个油泵加压站,如图加压站,如图2所示,所示,其中其中 分别为必分别为必须建站的地区,而须建站的地区,而 分分别为可供选择的各站点,各点连线上的数字表别为可供选择的各站点,各点连线上的数字表示相邻站点间铺设输送管道所需费用示相邻站点间铺设输送管道所需费用.问:如问:如何铺设石油输送管道,能使总费用最少?何铺设石油输送管道,能使总费用最少?20
17、23/4/123第二十三页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理(a)(b)2023/4/124第二十四页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理解解 划分成划分成4个阶段:个阶段:阶段变量依次为阶段变量依次为4,3,2,1,如图,如图2所示所示.设设阶段阶段k的状态变量为的状态变量为 。在阶段在阶段1:在阶段在阶段2:可以取可以取 中任意一个,对中任意一个,对应的有应的有 2023/4/125第二十五页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量,决策变量 ;从从 出发到终点出发到终点E最短
18、路径为最短路径为“”,决策变量,决策变量 ;从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量决策变量 ;2023/4/126第二十六页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理在阶段在阶段3:可以取可以取 中任意一个中任意一个,于是,于是 2023/4/127第二十七页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理从从 出发到终点出发到终点E最短路径为最短路径为“”或或 决策变量决策变量 或或 ;从从 出发到终点出发到终点E最短路径为最短路径为“”,决策变量,决策变量 ;从从 出发到终点出发到终点E最短路径为最短路径为“”或或 决策变量决策变量 或或 ;在阶段
19、在阶段4:2023/4/128第二十八页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理因此,由起点因此,由起点A到终点到终点E的费用最少路径有的费用最少路径有3条:条:此此3条路径对应的总费用均为条路径对应的总费用均为11单位金额。单位金额。2023/4/129第二十九页,讲稿共三十九页哦2 贝尔曼最优化原理贝尔曼最优化原理动态规划为我们提供了一种优秀的决策思动态规划为我们提供了一种优秀的决策思想:想:战略上追求全局优化,战术上稳扎稳战略上追求全局优化,战术上稳扎稳打、步步为营。这深刻地揭示了局部与全打、步步为营。这深刻地揭示了局部与全局的统一关系。局的统一关系。动态规划在实际中得到广
20、动态规划在实际中得到广泛应用,如可应用于背包问题、资源分配泛应用,如可应用于背包问题、资源分配问题、生产与存储问题、设备更新问题等。问题、生产与存储问题、设备更新问题等。需要指出的是:动态规划是一种求解思路,需要指出的是:动态规划是一种求解思路,注重决策过程,而不是一种算法,不同的注重决策过程,而不是一种算法,不同的问题模型各异。问题模型各异。2023/4/130第三十页,讲稿共三十九页哦3 WinQSB软件应用软件应用2023/4/131第三十一页,讲稿共三十九页哦本节结合最短路径问题、背包问题介绍WinQSB软件的应用,其他问题的求解可参考本章参考文献.求解动态规划问题,需要调用WinQS
21、B软件中的子程序“Dynamic Programming”.方法:点击“开始”“程序”“WinQSB”“Dynamic Programming”,屏幕显示如图3.3所示.该程序有3个子模块:最短路问题(Stagecoach Problem),背包问题(Knapsack Problem),生产与存储问题(Production and Inventory Scheduling).3 WinQSB软件应用软件应用2023/4/132第三十二页,讲稿共三十九页哦 3 WinQSB软件应用软件应用2023/4/133第三十三页,讲稿共三十九页哦1.最短路问题最短路问题【例3】用WinQSB软件求解例1.
22、解解(1)调用WinQSB软件中的子程序“Dynamic Programming”,建立新问题.在图3.3中选择第一项,输入标题和站点数.(2)输入数据.按照图3.1从左到右将相邻站点间的距离输入表3.1中,其中 表示图3.1中从左到右的第k 个站点,k=1,2,9表3.1 3 WinQSB软件应用软件应用2023/4/134第三十四页,讲稿共三十九页哦(3)求解)求解.点击菜单栏点击菜单栏“Solve and Analyze”“Solve the Problem”,得到图得到图3.4.再点击再点击“Solve”键,得到计算结果,键,得到计算结果,见表见表3.2.可见由起点到终点的最短路径为可
23、见由起点到终点的最短路径为 3 WinQSB软件应用软件应用2023/4/135第三十五页,讲稿共三十九页哦表表 2 3 WinQSB软件应用软件应用2023/4/136第三十六页,讲稿共三十九页哦2.背包问题背包问题背包问题的一般提法是:设有一位旅行者携带背包去登山,背包问题的一般提法是:设有一位旅行者携带背包去登山,已知他所能承受的背包质量为已知他所能承受的背包质量为a(单位:(单位:kg),),种物品可供他种物品可供他选择选择装入背包,其中第装入背包,其中第 种物品的重量种物品的重量为为(单单位:位:kg),其价,其价值值(可以是表明(可以是表明该该物品物品对对登山的重要性登山的重要性的
24、函数的函数 为为第第种物品种物品单单位位问问:旅行者:旅行者应应如何如何选择选择携携带带各物品的件数,以使各物品的件数,以使总总价价值值最大?最大?背包背包问题问题等同于等同于车车、船、船、飞飞机、潜艇、人造机、潜艇、人造卫卫星等工具的最星等工具的最优优装装载问题载问题,有广泛的,有广泛的实际实际意意义义.现有现有n 的数量指标)是携带数量的数量指标)是携带数量数量的价值,数量的价值,).3 WinQSB软件应用软件应用2023/4/137第三十七页,讲稿共三十九页哦【例例4 4】已知已知1T1T的集装箱最大载重量为的集装箱最大载重量为800kg.800kg.现有现有5 5种物品各种物品各10
25、10件可供选择装箱,其中单位物品重量、价值见表件可供选择装箱,其中单位物品重量、价值见表3.3.求价值最大求价值最大的装载方案的装载方案.表表3 3解解(1)调用调用WinQSB软件中子程序软件中子程序“Dynamic Programming”建立新问题:在图建立新问题:在图3.3中选择第二项,输入标题和物品品种数中选择第二项,输入标题和物品品种数5,见图,见图5.3 WinQSB软件应用软件应用2023/4/138第三十八页,讲稿共三十九页哦(2)按表)按表4形式输入数据:第形式输入数据:第1列为物品名称,第列为物品名称,第2列为物品列为物品限量及集装箱最大载重量,第限量及集装箱最大载重量,第3列为单位物品重量,第列为单位物品重量,第4列为列为物品价值函数物品价值函数.注:物品的数量仍用a,b,c,d,e表示.3 WinQSB软件应用软件应用2023/4/139第三十九页,讲稿共三十九页哦