《2022年遗传算法的基本原理 .pdf》由会员分享,可在线阅读,更多相关《2022年遗传算法的基本原理 .pdf(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章遗传算法的基本原理2.1 遗传算法的基本描述2.1.1 全局优化问题全局优化问题的定义: 给定非空集合S 作为搜索空间, f:SR 为目标函数,全局优化问题作为任务)(maxxfSx给出,即在搜索空间中找到至少一个使目标函数最大化的点。全局最大值(点)的定义: 函数值)(*xff称为一个全局最大值,当且仅当)()(*xfxfSx成立时,Sx*被称为一个全局最大值点(全局最大解) 。局部极大值与局部极大值点(解)的定义:假设在 S上给定了某个距离度量,如果对Sx,0,使得对Sx,)()(),(xfxfxx,则称 x为一个局部极大值点, f(x )为一个局部极大值。当目标函数有多个局部极大点
2、时,被称为多峰或多模态函数 (multi-modality function) 。主要考虑两类搜索空间:伪布尔优化问题: 当 S 为离散空间 BL=0,1L,即所有长度为 L 且取值为 0 或1 的二进制位串的集合时,相应的优化问题在进化计算领域称为伪布尔优化问题。连续参数优化问题:当取 S 伪 n 维实数空间 Rn中的有界集合,1iinibaS,其中iiba,i = 1, 2, , n 时,相应的具有连续变量的优化问题称为连续参数优化问题。对 S为 BL=0,1L,常采用的度量时海明距离,当,1iinibaS时,常采用的度量就是欧氏距离。2.1.2 遗传算法的基本流程名师资料总结 - - -
3、精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 22 页 - - - - - - - - - 遗传算法的基本步骤如下:1)选择编码策略,把参数集合X 和域转换为位串结构空间S;2)定义适应度函数f(X);3)确定遗传策略,包括群体规模,选择、交叉、变异算子及其概率。4)生成初始种群 P;5)计算群体中各个体的适应度值;6)按照遗传策略,将遗传算子作用于种群,产生下一代种群;7)迭代终止判定。遗传算法涉及六大要素:参数编码,初始群体的设定,适应度函数的设计,遗传操作的设计,控制参数的设定,迭代终止
4、条件。2.1.3 遗传编码由于 GA 计算过程的鲁棒性,它对编码的要求并不苛刻。原则上任何形式的编码都可以, 只要存在合适的对其进行操作的遗传算子,使得它满足模式定理和积木块假设。由于编码形式决定了交叉算子的操作方式,编码问题往往称作编码-交叉问题。对于给定的优化问题,由GA 个体的表现型集合做组成的空间称为问题(参数)空间 ,由 GA 基因型个体所组成的空间称为GA编码空间 。遗传算子在GA名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 22 页 - - - - - -
5、 - - - 编码空间中对位串个体进行操作。定义:由问题空间向 GA 编码空间的映射称为编码,而有编码空间向问题空间的映射成为译码。问题编码一般应满足以下三个原则:1)完备性 (completeness ) :问题空间中的所有点都能能成为GA 编码空间中的点的表现型。即编码应能覆盖整个问题空间。2)健全性(soundness ) :GA 编码空间中的染色体位串必须对应问题空间中的某一潜在解。即每个编码必须是有意义的。3)非冗余性 (non-redundancy ) :染色体和潜在解必须一一对应。在某些情况下,为了提高GA 的运行效率,允许生成包含致死基因的编码位串,它们对应于优化问题的非可行解
6、。虽然会导致冗余或无效的搜索,但可能有助于生成全局最优解所对应的个体,所需的总计算量可能反而减少。根据模式定理, De Jong进一步提出了较为客观明确的编码评估准则,称之为编码原理。具体可以概括为两条规则:1)有意义积木块编码规则 :编码应易于生成与所求问题相关的短距和低阶的积木块。2)最小字符集编码规则 :编码应采用最小字符集,以使问题得到自然、简单的表示和描述。1二进制编码1)连续实函数的二进制编码设一维连续实函数,),(vuxxf采用长度维L 的二进制字符串进行定长编码,建立位串空间:KLaaaS,21,),(21kLkkkaaaa,1 ,0klak=1,2,K; l=1,2,L; K
7、=2L 其 中 , 个 体 的 向 量 表 示 为),(21kLkkkaaaa, 其 字 符 串 形 式 为kLkkkaaas21,sk称为个体 ak对应的位串。表示精度为)12/()(Luvx。将个体又位串空间转换到问题空间的译码函数, 1 ,0 :vuL的公式定义为:)2(12),(121LjjLkjLkLkkkauvuaaax名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 22 页 - - - - - - - - - 对于 n 维连续函数),2, 1(,),(),(
8、21nivuxxxxxxfiiin,各维变量的二进制编码位串的长度为li,那么 x 的编码从左到右依次构成总长度为niilL1的二进制编码位串。相应的GA 编码空间为:,21KLaaaS,K=2L 该空间上的个体位串结构为 1 , 0),(2121222211121121iklnklnknkiklikikklkkklkkkaaaaaaaaaaaaaaninklnknkiklikikklkkklkkkniaaaaaaaaaaaas2121222211121121对于给定的二进制编码位串sk,位段译码函数的形式为)2(12),(121iiiiljjlikjliiiiklikikiiauvuaaax
9、, i = 1,2,n 采用二进制编码的GA 进行数值优化时,可以通过改变编码长度,协调搜索精度和搜索效率之间的关系。2) 组合问题的二进制编码在很多组合优化问题中,目标函数和约束函数均为离散函数,采用二进制编码往往具有直接的语义,可以将问题空间的特征与位串的基因相对应。2其他编码1)大字符集编码2)序列编码3)实数编码4)树编码5)自适应编码6)乱序编码7)二倍体和显性规律Lawrence Davis 等学者主张:采用的编码对问题来讲应该时最自然的,并可以据此设计能够处理该编码的遗传算子。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - -
10、 - - 名师精心整理 - - - - - - - 第 4 页,共 22 页 - - - - - - - - - 2.1.4 群体设定遗传算法的两个主要特点之一就是基于群体搜索的策略,群体的设定,尤其是群体规模的设定, 对遗传算法性能有着重要的影响。这中间包括两个问题: 1)初始群体如何设定; 2)进化过程中各代的规模如何维持?1 初始群体的设定遗传算法中初始群体中的个体是按一定的分布随机产生的,一般来讲,初始群体的设定可以采用如下的策略:1) 根据问题固有知识,设法把握最优解所占空间在整个问题空间中的分布范围,然后,在此分布范围内设定初始群体。2) 先随机生成一定数目的个体,然后从中挑出最好
11、的个体加入到初始群体中。这一过程不断重复,直到初始群体中个体数达到了预定的规模。2 群体规模的设定根据模式定理,若群体规模为M,则遗传操作可从这M 个个体中生成和检测 O(M3)个模式,并在此基础上不断形成和优化积木块,直到找到最优解。显然M 越大,遗传操作处理的模式就越多,生成有意义的积木块并逐渐进化为最优解的机会就越高。换句话说,群体规模越大,群体中个体的多样性越高,算法陷入局部最优解的危险就越小。另外,群体规模太小,会使遗传算法的搜索空间分布范围有限,因而搜索有可能停止在未成熟阶段,引起未成熟收敛(premature convergence )现象。但是,从计算效率来看,群体规模越大,其
12、适应度评价次数越多,计算量也就越大,从而影响算法的效率。研究表明,在二进制编码的前提下,为了满足隐并行性,群体个体数只要设定为 2L/2即可,L 为个体串长度。这个数比较大,实际应用中群体规模一般取几十几百。2.1.4 适应度函数(评价函数)遗传算法在进化搜索中基本不用外部信息,仅用目标函数即适应度函数为依据。遗传算法的目标函数不受连续可微的约束且定义域可以为任意集合。对适应度函数的唯一要求是, 针对输入可计算出能加以比较的非负结果(比例选择算子需要) 。需要强调的是,适应度函数值是选择操作的依据,适应度函数设计直接影响到遗传算法的性能。1 目标函数映射成适应度函数对于给定的优化问题,目标函数
13、有正有负,甚至可能是复数值,所以有必要通过建立适应度函数与目标函数的映射关系,保证映射后的适应度值是非负的,而且目标函数的优化方向应对应于适应度值增大的方向。1)对最小化问题,建立如下适应函数和目标函数的映射关系:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 22 页 - - - - - - - - - 否则若, 0)(),()(maxmaxcxgxgcxf其中, cmax可以是一个输入值或是理论上的最大值,或者是当前所有大或最近 K 代中 g(x)的最大值,此时cma
14、x随着代数会有变化。2)对于最大化问题,一般采用以下映射:否则若, 00)(,)()(minmincxgcxgxf其中, cmin可以是一个输入值,或者是当前所有代或最近K 代中 g(x)的最小值2 适应度函数定标在遗传进化的初期,通常会出现一些超常个体,若按比例选择策略,这些异常个体有可能在群体中占据很大的比例,导致未成熟收敛。 显然,这些异常个体因竞争力太突出,会控制选择过程,从而影响算法的全局优化性能。另以方面,在遗传进化过程中,虽然群体中个体多样性尚存在,但往往会出现群体的平均适应度已接近最佳个体适应度,这时,个体间的竞争力相似, 最佳个体和其它个体在选择过程中有几乎相等的选择机会,从
15、而使有目标的优化过程趋于无目标大的随机搜索过程。对未成熟收敛现象,应设法降低某些异常个体的竞争力,这可以通过缩小相应的适应度值来实现。 对于随机漫游现象, 应设法提高个体间的竞争力差距,这可以通过放大相应的适应度值来实现。这种适应度的缩放调整称为适应度定标。1)线性定标 (linear scaling)f = af + b 2)截断(sigma truncation))(cfff3) 乘幂标f = fK4) 指数定标f = exp(-bf) 2.1.5 遗传算子遗传操作是模拟生物基因遗传的操作。包括三个基本遗传算子(genetic operator) :选择,交叉和变异。这三个遗传算子具有一些
16、特点:(1) 这三个算子的操作都是在随机扰动情况下进行的。换句话说,遗传操作是随机化操作,因此,群体中个体向最优解迁移的规则是随机的。需名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 22 页 - - - - - - - - - 要强调的是,这种随机化操作和传统的随机搜索方法是有区别的。遗传操作进行的是高效有向的搜索,而不是如一般随机搜索方法所进行的无向搜索。(2) 遗传操作的效果和所取的操作概率、编码方法、群体大小,以及适应度函数的设定密切相关。(3) 三个基本算子的操
17、作方法和操作策略随具体求解问题的不同而异。或者说,是和个体的编码方式直接相关。1、选择(selection)算子从群体中选择优胜个体,淘汰劣质个体的操作叫选择。选择算子有时又称为再生算子( reproduction operator) 。选择即从当前群体中选择适应度值高的个体以生成配对池( mating pool)的过程。为了防止由于选择误差,或者交叉和变异的破坏作用而导致当前群体的最佳个体在下一代的丢失,De Jong提出了精英选择(elitist selection)策略和代沟的概念。 Holland 等提出了稳态选择 (steady-state selection)策略。下面一些概念可以
18、用来比较不同的选择算法:(1)选择压力 (selection pressure) :最佳个体选中的概率与平均选中概率的比值。(2)偏差(bias) 个体正规化适应度与其期望再生概率的绝对差值。(3)个体扩展 (spread) 单个个体子代个数的范围。(4)多样化损失 (loss of diversity) 在选择阶段末选中个体数目占种群的比例。(5)选择强度 (selection intensity) 将正规高斯分布应用于选择方法,期望平均适应度。(6)选择方差 (selection variance) 将正规高斯分布应用于选择方法,期望种群适应度的方差。1) 适应度比例选择是最基本的选择方法
19、, 其中每个个体被选择的期望数量与其适应度值和群体平均适应度值的比例有关,通常采用轮盘赌(roulette wheel)方式实现。这种方式首先计算每个个体的适应度值, 然后计算出此适应度值在群体适应度值总和中所占的比例, 表示该个体在选择过程中被选中的概率。选择过程体现了生物进化过程中“适者生存,优胜劣汰”的思想。对于给定的规模为n 的群体,21naaaP,个体Paj的适应度值为)(jaf,其选择概率为:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 22 页 - - -
20、 - - - - - - njafafapniijjs,2 , 1,)()()(1经过选择操作生成用于繁殖的配对池,其中父代种群中个体生存的期望数目为:njapnaPjsj,2, 1),()(当群体中个体适应度值的差异非常大时,最佳个体与最差个体被选择的概率之比(选择压力)业将按指数增长。最佳个体在下一代的生存机会将显著增加,而最差个体的生存机会将被剥夺。当前群体中的最佳个体将快速充满整个群体,导致群体的多样性迅速降低,GA 也就过早地丧失了进化能力。这是适应度比例选择容易出现地问题。2)Boltzmann 选择在群体进化过程中, 不同阶段需要不同地选择压力。 早期阶段选择压力较小,我们希望较
21、差地个体也又一定地生存机会,使得群体保持较高地多样性; 后期阶段,选择压力较大,我们希望GA 缩小搜索邻域,加快当前最优解的改善速度。为了动态调整群体进化过程中的选择压力,Goldberg设计了 Boltzmann选择方法。个体选择概率为:njeeapniTafTafjsij,2, 1,)(1/ )(/ )(其中,T0 是退火温度。 T 随着迭代地进行逐渐缩小, 选择压力将随之升高。T 是控制群体进化过程中选择压力的关键,一般 T 的选择需要考虑预计最大进化代数。3) 排序选择排序选择方法是将群体中个体按其适应度值由大到小的顺序排成一个序列,然后将事先设计好的序列概率分配给每个个体。显然,排序
22、选择域个体的适应度值的绝对值之间无直接关系, 仅仅与个体之间适应度值的相对大小有关。排序选择不利用个体适应度值绝对值的信息,可以避免群体进化过程中的适应度标度变换。由于排序选择概率比较容易控制,所以在实际计算过程中经常采用,特别是适用于动态调整选择概率, 根据进化效果适时改变群体的选择压力。最常用的排序选择方法是采用线性函数将队列序号映射为期望的选择概率,即线性排序选择(linear ranking selection) 。对于给定的规模为n 的群体,21naaaP,并且满足个体适应度值降序排列)()()(21nafafaf。假设当前群体最佳个体a1在选择操作后的期望名师资料总结 - - -精
23、品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 22 页 - - - - - - - - - 数量为,即1pn;最差个体 an在选择操作后的期望数量为npn。其 它 个 体 的 期 望 数 量 按 等 差 序 列 计 算 ,11njj则)1(1)()1(jnjj,故现在排序选择概率为njjnnapjs,2, 1),1(1)(1)(由nnjj1可以导出2。要求0,0ip,故21。当0,2时,即最差个体在下一代生存的期望数量为0, 群体选择压力最大;当1时,选择方式为按均匀分布的随机选择,群体选择压力
24、最小。4)联赛选择 (tournament selection )联赛选择的基本思想是从当前群体中随机选择一定数量的个体(放回或者不放回) ,将其中适应值最大的个体放入配对池中。反复执行这一过程,直到配对池中的个体数量达到设定的值。联赛规模用 q 表示,也称 q-联赛选择。 联赛选择与个体的适应度值由间接关系,注重适应度值大小的比较。根据大量实验总结,联赛规模一般取 q=2。联赛选择的选择概率也是比较容易控制的,实际计算中也经常采用,适用于在 GA 迭代过程中动态调整选择概率,将进化效果与群体选择压力联系起来。研究证明,当群体规模比较大时,联赛选择与排序选择的个体选择概率基本相同。5) 精英选
25、择从 GA 的整个选择策略来讲,精英选择时群体收敛导优化问题全局最优解的一种基本保障。如果下一代群体的最佳个体适应度值小于当前群体最佳个体的适应度值,则将当前群体最佳个体或者适应度值大于下一代最佳个体适应度值的多个个体直接复制到下一代, 随机替代和替代最差的下一代群体中的相应数量的个体。6) 稳态选择De Jong将下一代群体中生成的与上一代不同的新个体所占的比例称为“代沟” (generation gap ) 。代沟越大,说明新个体的生成比例越高,群体正在搜索新的编码空间。稳态选择操作中,仅有少量个体按适应度值比例选择方法被选择,通过遗传操作生成新的个体。 新个体放回到群体中时, 随机替代等
26、量的旧个体, 或者替代等量的最差的旧个体。 Holland 将稳态选择方法应用于分类器规则学习中,最大名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 22 页 - - - - - - - - - 程度继承已获得的规则,实现增量学习。2、交叉(crossover )算子交叉操作时进化算法中遗传算法具有的原始性的独有特征。GA 交叉算子时模仿自然界有性繁殖的基因重组过程,其作用在于将已有的优良基因遗传给下一代个体, 并生成包含更复杂基因结构的新个体。 交叉操作一般分为以下几个
27、步骤:1)从配对池中随机取出要交配的一对个体;2)根据位串长度L,对要交叉的一对个体,随机选取1, L-1 中一个或多个整数 k 作为交叉位置;3)根据交叉概率实施交叉操作,配对个体在交叉位置处,相互交换各自的部分内容,从而形成新的一对个体。实现个体结构重组的交叉算子的设计一般与所求解的具体问题有关,任何交叉算子需满足交叉算子的评估准则, 即交叉算子需保证前一代中优秀个体的性状能在下一代的新个体中尽可能得到遗传何继承。此外,交叉算子设计和编码设计需协调操作。1)一点交叉 (one-point crossover )一点交叉是由 Holland 提出的最基础的一种交叉方式。一点交叉操作的信息量比
28、较小, 交叉点位置的选择可能带来较大的偏差(position bias) 。按照 Holland的思想,一点交叉算子不利于长距模式的保留和重组,而且位串末尾的重要基因总是被交换(尾点效应,end-point effect) 。故实际应用中采用较多的是两点交叉。位串 A:1 1 0 1| 1 0 1 0 位串 B:1 0 1 1| 0 1 0 1 位串 A :1 1 0 1 0 1 0 1 位串 B :1 0 1 1 1 0 1 0 2)两点交叉 (two-point crossover)位串 A:1 1| 0 1 1| 0 1 0 位串 B:1 0| 1 1 0| 1 0 1 位串 A :1
29、1| 1 1 0| 0 1 0 位串 B :1 0| 0 1 1| 1 0 1 3)多点交叉 (multi-point crossover)多点交叉是上述两种交叉的推广,有时又被称为广义交叉。一般来讲,多点交叉较少采用, 因为它影响遗传算法的在线和离线性能。多点交叉不利于有效保存重要的模式。位串 A:1 1| 0 1| 1 0| 1 0 位串 B:1 0| 1 1| 0 1| 0 1 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 22 页 - - - - - - -
30、- - 位串 A :1 1| 1 1| 1 0| 0 1 位串 B :1 0| 0 1| 0 1| 1 0 4) 一致交叉一致交叉即染色体位串上的每一位按相同概率进行随机均匀交叉。一致交叉算子生成的新个体位:Laaas112111,Laaas222212,操作描述如下:),(xpOc:2/1,2/1,211xaxaaiii;2/1,2/1,122xaxaaiiix 是取值为 0,1上符合均匀分布的随机变量。Spears和 De Jong认为一致交叉算子优于多点交叉算子,并提出一种带偏置概率的一致交叉(5 .08. 0 x) ,不存在多点交叉算子操作引起的位置偏差,任意基因位的重要基因在一致交叉
31、作用下均可以重组,并遗传给下一代个体。3、 逆转算子在自然遗传学中有一种称作倒位的现象,在染色体中有两个倒位点,在这两点之间的基因位置倒换, 使得那些在父代中离得很远得基因位在后代中紧靠在一起。在 GA 中相当于重新定义基因块,使染色体位串上得重要基因更加紧凑,更不易被交叉算子所分裂。仿照此现象,Holland 提出了逆转算子。逆转操作首先在个体位串上随机地选择两个点,位串染色体被这两个点分成三段,将中间段的左右顺序倒转过来与另两段相连,形成新的个体位串。比如:长度为 10 的二进制位串,其中下划线标示的等位基因为重要基因:1011101101 (是倒位位置)经倒位后变为 1011011101
32、 。新的位串中重要基因更为靠近,被单点交叉算子分离的可能性大大降低了。逆转算子一般要求采用类似于乱序编码的带基因位标号的染色体结构。比如,长度为 10 的位串:位串:1 0 1 1 1 0 1 1 0 1 基因位编号: 1 2 3 4 5 6 7 8 9 10 按照上述方法实施逆转操作后,编号也随之翻转:位串:1 0 1 1 0 1 1 1 0 1 基因位编号: 1 2 8 7 6 5 4 3 9 10 这样倒位操作就不会影响个体位串的适应值计算。但是,逆转算子对交叉算子有一定影响。考虑下列A,B 位串之间的单点交叉:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - -
33、 - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 22 页 - - - - - - - - - 位串 A:1 0 1 1 1 0 1 1 0 1 基因位编号: 1 2 3 4 5 6 7 8 9 10 位串 B:1 0 1 1 0 1 1 1 0 1 基因位编号: 1 2 8 7 6 5 4 3 9 10 若简单地将第 4 个基因位以右的部分位串进行交换,得到:位串 A :1 0 1 1 0 1 1 1 0 1 基因位编号: 1 2 3 4 6 5 4 3 9 10 位串 B :1 0 1 1 1 0 1 1 0 1 基因位编号: 1 2 8 7
34、 5 6 7 8 9 10 两个子代位串中第3、4 和 7、8 位基因在 A 、B中重复或遗漏,导致子代个体中包含冗余或不完整的遗传信息。为解决此问题,一般遵循五种交换规则:1)严格同序交换 ,只允许同序位串才能交换。2)生存性交换 ,允许不同序位串进行交换,如果子代码串不包含完整的遗传信息,则不把它们放入新一代群体中。3)任选方案交换 ,随意选择两个位串,并将其中任何一个指定为主序位申,另一个位串则按主序位串的次序映射,然后再进行通常的交换, 这样保证了交换结果的合法性。4)最佳方案交换 ,与任选方案交换基本相同,只是将两个位串中适应值高的位串作为主序位串。5)结构修复 ,对于两个子代位串中
35、重复或短缺的基因,随机将重复的基因改变为缺省的基因,形成完整的位串结构。目前,这五种原则在基于二进制编码的参数优化问题的GA 求解中还很少采用。对于某些问题要求采用具有显著物理含义的特殊编码方式,可以根据 GA 进化的困难程度适当应用。4、变异(mutation)算子变异操作模拟自然界生物体进化中染色体上某位基因发生的突变现象,从而改变染色体的结构和物理性状。在遗传算法中,变异算子通过按变异概率pm随机 反 转 某 位 等 位 基因 的 二 进 制 字 符 值 来 实 现 。 对 于 给定 的 染 色 体 位 串Laaas21,具体如下::),(xpOm否则若,1imiiiapxaa,2, 1
36、Li生成新的个体Laaas21。其中, xi是对应于每一个基因位产生的均匀名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 22 页 - - - - - - - - - 随机变量,0, 1ix。变异操作作用于个体位串的等位基因上,由于变异概率比较小,在实施过程中一些个体可能根本不发生一次变异,造成大量计算资源的浪费。因此,在GA具体应用中, 我们可以采用一种变通措施, 首先进行个体层次的变异发生的概率判断,然后再实施基因层次上的变异操作。一般包括两个基本步骤:1)计算个体
37、发生变异的概率以原始的变异概率pm为基础,可以计算出群体中个体发生变异的概率:njpapLmjm,2 , 1,)1(1)(给定均匀随机变量0 ,1ix,若)(jmapx,则对该个体进行变异,否则表示不发生变异。2)计算发生变异的个体上基因变异的概率由于变异操作方式发生了改变,被选择变异的个体上基因的变异概率也需要相应修改,以保证整个群体上基因发生变异的期望次数相等。传统变异方式下整个群体基因变异的期望次数为mpLn。设新的基因变异概率为mp,新的变异方式下整个群体基因变异的期望次数为)()(mjmpLapn: 。 要求两者相等,即)()(mjmmpLapnpLn可以导出:Lmmjmmmppap
38、pp)1(1)(。mmpp, 位串越短,mp越比mp大。当位串长度趋于无穷大时,两者相等,即mmLpplim。传统变异方式下的计算量为nL,新的变异方式下的计算量npm(aj)L,计算量差异为 nL(1pm(aj),显然新的变异方式比传统方式计算量降低了,且随着位串长度的增大而下降。 但是,这种新变异方式也在一定程度上偏离了原来的变异基因位在全部群体个体基因位中的均匀分布的情况,当群体比较小时,可能会带来一定的变异误差。从第 t 代群体中由选择、交叉所生成的交配池中,依次选择个体进行随机变异操作的一般形式表示为P(t)m(P(t),pm) 变异操作按一定的概率pm对位串上的某些基因位的值进行变
39、异, 即 1变为 0,或 0 变成 1。为了保证个体变异后不会与其父体产生太大的差异,变异概率一般取值较名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 22 页 - - - - - - - - - 小,以保证种群发展的稳定性。当交叉操作产生的后代个体的适应值不再比它们的前辈更好,但又未达到全局最优解时,就会发生成熟前收敛或早熟收敛(Premature convergence ) 。这时引入变异算子往往能产生很好的效果。一方面,变异算子可以使群体进化过程中丢失的等位基因信
40、息得以恢复, 以保持群体中的个体差异性, 防止发生成熟前收敛;另一方面, 当种群规模较大时, 在交叉操作基础上引人适度的变异,也能够提高遗传算法的局部搜索效率。在群体进化的整个过程中,交叉操作是主要的基因重组和群体更迭的手段,变异操作的作用是第二位的, 变异算子仅仅充当背景性的角色 (background role ) 。针对具体问题以及为了便于对进化过程实施控制,在标准变异算子的基础上, 又引人了其他类型的变异算子,比如:特定有效位变异(高位、低位),变异概率自适应调整、 面向领域知识的位变异等, 使得遗传算法的应用范围和应用效果得到较好的改善。在很多组合优化问题中, 往往存在着多个最优解或
41、者最优解往往被环绕在大量的局部最优解之中, 应用 GA 求解该类问题很容易形成模式欺骗问题,此时可以采用补算算子(Complementary operator ) 增加群体多样性或者克服模式欺骗性。基于1,0 字符集表示的二进制染色体位串Laaas21,补算算子具体操作形式如下:O(com, s ): ai = 1 ai, i = 1,2, L对于位串上每一个基因位,若等位基因为0,则变为 1,否则变为 0,从而形成新得位串。例如: s = 10111011 ,补算运算结果: s = 01000100。2.1.6 循环终止条件关于 GA 迭代过程如何终止, 一般采用设定最大代数的方法。该方法简
42、单易行但不准确。 其次,可以根据群体的收敛程度来判断,通过计算种群中的基因多样性测度,即所有基因位的相似性程度来进行控制。第三,根据算法的离线性能和在线性能的变化进行判定。最后,在采用精英保留选择策略的情况下,按每代最佳个体的适应值的变化情况确定。一般循环终止条件表示为T(P(t)true。2.1.7 标准 GA的流程1)设代数 t = 0 2)初始化种群3)适应性评价4)while T(P(t)true do a)选择b)交叉c)变异d)新一代种群名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - -
43、 - - 第 14 页,共 22 页 - - - - - - - - - e)适应性评价5)end do 2.1.8 控制参数在遗传算法的运行过程中,存在着对其性能产生重大影响的一组参数。这组参数在初始阶段或群体进化过程中需要合理的选择和控制,以使 GA以最佳的搜索轨迹达到最优解。 主要参数包括染色体位串长度L,群体规模 n,交叉概率 Pc以及变异概率 Pm。许多学者进行了大量实验研究,给出了最优参数建议。1)位串长度L:位串长度 L 的选择取决于特定问题解的精度。要求的精度越高,位串越长,但需要更多的计算时间。为提高运算效率,变长度位串或者在当前所达到的较小可行域内重新编码,是一种可行的方法
44、,并显示了良好性能。2)群体规模 n:大群体含有较多模式, 为遗传算法提供了足够的模式采样容量,可以改进 GA 搜索的质量,防止成熟前收敛。但大群体增加了个体适应性评价的计算量,从而使收敛速度降低。一般情况下专家建议n20200。3)交叉概率 Pc:交叉概率控制着交叉算子的应用频率,在每一代新的群体中,需要对 Pcn 个个体的染色体结构进行交叉操作。交叉概率越高, 群体中新结构的引人愈快, 已获得的优良基因结构的丢失速度也相应升高。而交叉概率太低则可能导致搜索阻滞。一般取Pc = 0.601.00。4)变异概率 Pm :变异操作是保持群体多样性的有效手段,交叉结束后,交配池中的全部个体位串上的
45、每位等位基因按变异率Pm 随机改变,因此每代中大约发生 PmnL 次变异。变异概率太小, 可能使某些基因位过早丢失的信息无法恢复;而变异概率过高, 则遗传搜索将变成随机搜索。 一般取 Pm = 0.0050.01 。实际上,上述参数与问题的类型有着直接的关系。问题的目标函数越复杂,参数选择就越困难。从理论上来讲,不存在一组适用于所有问题的最佳参数值,随着问题特征的变化, 有效参数的差异往往非常显著。 如何设定遗传算法的控制参数以使遗传算法的性能得到改善,还需要结合实际问题深人研究, 以及有赖于遗传算法理论研究的新进展。2.1.9 GA的性能评估GA 的运行性能与很多因素有关。针对求解同一优化问
46、题,不同参数设置的两个或者多个 GA,或者 GA 与其他启发式搜索算法,如何进行性能比较呢?关于搜索类算法的性能评估,一般可以归纳为算法的求解效率和求解质量两个方面。算法的求解效率是比较获得同样的可行解所需要的计算时间。算法的求解质量是在规定的时间内 (或者时间相关指标) 所获得的可行解的优劣。 这里主要介绍常用和通用的两个指标。1适应值函数计算次数该指标是指发现同样适应性的个体,或者找到同样质量的可行解,所需要的关于个体评价的适应值函数的计算次数(function evaluations) 。显然,该值越小说明相应 GA 的搜索效率越高。同样,在预定的适应值函数计算次数的情况下,比较所发现的
47、最佳个体或者找到的可行解的质量,也可以判断不同 GA 的搜索能名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 22 页 - - - - - - - - - 力。该指标不仅可以用于不同参数设置GA 的性能比较,也可以用于GA 与其他搜索算法的比较。适应值函数的计算次数一般采用群体规模与进化代数的乘积,其中往往不考虑代沟大小的影响。2在线和离线性能函数De Jona在将 GA 用于一组优化函数求解的比较分析时,提出了 GA 的在线评价指标和离线评价指标两个函数。1) 线性能
48、函数 (on-line performance ) :设 GA 的遗传策略为 s(包括 L ,n,Pc,Pm,算子形式等),该策略的在线性能:TtnjjlineontafTnsP01,_)()1(1)(即在线性能反映了群体平均适应值经平滑处理后的变化情况,描述了群体的整体性状和进化能力。2) 离线性能函数 (offline performance) :对于 GA 遗传策略 s,其离线性能TtlineofftafTsP0*_),(11)(其中, f(a*,t)maxf(al,t),f(a2,t), f(an,t) ,即当前群体中最佳个体的适应值。该指标 反映了群体中最佳个体适应值经平滑处理后的变
49、化情况,描述了个体的进化能力和GA的搜索能力 。关于上述适应值的平滑处理,也可以通过赋予进化过程中各代不同的权重,改变为适应值的加权平均计算,以消除初始群体带来的误差。3最优解搜索性能GA 用于函数优化的目的就是发现问题的全局最优解,所以通常采用当前群体发现的最佳可行解的改善情况作为度量GA 搜索能力的基本指标。 对于 GA 遗传策略 S,性能函数为:Pbest(s, t) = f(a*, t) 其中, Pbest可以反映 GA 搜索到全局最优解的过程、速度、早熟等情况,也是适应性参数调整的基础。另外,结合具体的应用实例,还可以设计一系列具有不同物理含义的性能评价函数和指标。22 遗传算法的模
50、式理论虽然 GA 计算过程和形式简单,但是其运行机理非常复杂。随着GA 在复杂优化问题求解和实际工程设计中的应用,人们对 GA 的理论基础给予了越来越多名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 22 页 - - - - - - - - - 的关注。主要问题包括:1)采用怎样的规律和模型来描述GA 的宏观行为, GA 进化过程中如何预测适应值的变化,以及特定GA 形式下的群体结构的进化动力行为。2)如何评价 GA 性能的优劣,采用怎样的评价标准。3)GA 适用于哪些