模拟退火算法伪代码

Report
模拟退火算法_
简要介绍
指导教师:钟翠萍
主讲人:崔旭辉
爬山算法 ( Hill Climbing )
• 介绍模拟退火前,先介绍爬山算法。
爬山算法是一种简单的贪心搜索算法,
该算法每次从当前解的临近解空间中
选择一个最优解作为当前解,直到达
到一个局部最优解。
爬山算法实现很简单,其主要缺点是会陷入局部最优解,而
不一定能搜索到全局最优解。如图1所示:假设C点为当前解,
爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A
点无论向那个方向小幅度移动都不能得到更优的解。
图1
•
爬山法是完完全全的贪心法,每次都鼠目寸光的
选择一个当前最优解,因此只能搜索到局部的最
优值。
• 模拟退火其实也是一种贪心算法,但是它的搜索
过程引入了随机因素。模拟退火算法以一定的概
率来接受一个比当前解要差的解,因此有可能会
跳出这个局部的最优解,达到全局的最优解。
以图1为例,模拟退火算法在搜索到局部最优解A
后,会以一定的概率接受到E的移动。也许经过
几次这样的不是局部最优的移动后会到达D点,
于是就跳出了局部最大值A。
图1
• 关于爬山算法与模拟退火,有一个有趣的比喻:
• 爬山算法:兔子朝着比现在高的地方跳去。它
找到了不远处的最高山峰。但是这座山不一定
是珠穆朗玛峰。这就是爬山算法,它不能保证
局部最优值就是全局最优值。
• 模拟退火:兔子喝醉了。它随机地跳了很长时
间。这期间,它可能走向高处,也可能踏入平
地。但是,它渐渐清醒了并朝最高方向跳去。
这就是模拟退火。
模拟退火算法简介:
• 模拟退火算法(Simulated Annealing,SA)最早的
思想是由N. Metropolis[1]等人于1953年提出。
• Metropolis准则提出
• 固体在恒定温度下达到热平衡的过程可以
用MorteCarol算法方法加以模拟,虽然该
方法简单,但必须大量采样才能得到比较
精确的结果,因而计算量很大。
• 鉴于物理系统倾向于能量较低的状态,而
热运动又妨碍它准确落到最低态。采样时
着重选取那些有重要贡献的状态则可较快
达到较好的结果。因此,Metropolis等在
1953年提出了重要的采样法,即以概率接
受新状态。
Metropolis准则:
假设在状态xold时,系统受到某种扰动而使其
状态变为xnew。与此相对应,系统的能量也从
E(xold)变成E(xnew),系统由状态xold变为状态
xnew的接受概率p:
模拟退火算法原理:
• 模拟退火算法来源于固体退火原理,将固体加温至充分高,
再让其徐徐冷却,加温时,固体内部粒子随温升变为无序
状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度
都达到平衡态,最后在常温时达到基态,内能减为最小。
物理退火过程:
(1)加温过程
(2)等温过程
(3)冷却过程
• 根据Metropolis准则,粒子在温度T时趋于平衡的
概率为exp(-ΔE/(kT)),其中E为温度T时的内能,
ΔE为其改变量,k为Boltzmann常数。
• 用固体退火模拟组合优化问题,将内能E模拟为目
标函数值f,温度T演化成控制参数t。
• 即得到解组合优化问题的模拟退火算法:由初始
解i和控制参数初值t开始,对当前解重复“产生
新解→计算目标函数差→接受或舍弃”的迭代,
并逐步衰减t值,算法终止时的当前解即为所得近
似最优解。
• 这是基于蒙特卡罗迭代求解法的一种启发式随机
搜索过程。退火过程由冷却进度表(Cooling
Schedule)控制,包括控制参数的初值t及其衰减
因子Δt、每个t值时的迭代次数L和停止条件S。
• 根据热力学的原理,在温度为T时,出现能量差为dE的降
温的概率为P(dE),表示为:
P(dE) = exp( dE/(kT) )
• 其中k是一个常数,exp表示自然指数,且dE<0。这条公式
说明的就是:温度越高,出现一次能量差为dE的降温的概
率就越大;温度越低,则出现降温的概率就越小。又由于
dE总是小于0(否则就不叫退火了),因此dE/kT < 0 ,
所以P(dE)的函数取值范围是(0,1) 。
• 随着温度T的降低,P(dE)会逐渐降低。
• 我们将一次向较差解的移动看做一次温度跳变过程,我们
以概率P(dE)来接受这样的移动。
模拟退火算法描述:
•
若J( Y(i+1) )>= J( Y(i) )
则总是接受该移动。
•
若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要
差),则以一定的概率接受移动,而且这个概率随着时间
推移逐渐降低(逐渐降低才能趋向稳定)。
(即移动后得到更优解),
• 这里的“一定的概率”的计算参考了金属冶炼的退火过程,
这也是模拟退火算法名称的由来。
模拟退火算法模型:
• 模拟退火算法可以分解为解空间、目标函数和初始解三部分。
• 模拟退火的基本思想:
(1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点),
每个T值的迭代次数L
自然常数e为底的
(2) 对k=1,……,L做第(3)至第6步:
指数函数
(3) 产生新解S′
(4) 计算增量Δt′=C(S′)-C(S),其中C(S)为评价函数
(5) 若Δt′<0则接受S′作为新的当前解,否则以概率exp(-Δt′/T)接
受S′作为新的当前解.
(6) 如果满足终止条件则输出当前解作为最优解,结束程序。终止条件
通常取为连续若干个新解都没有被接受时终止算法。
(7) T逐渐减少,且T->0,然后转第2步。
算法对应演示图:
第一步是由一个产生函数从
当前解产生一个位于解空间
的新解。
为便于后续的计算和接受,
减少算法耗时,通常选择由
当前新解经过简单地变换即
可产生新解的方法。
如对构成新解的全部或部分
元素进行置换、互换等,注
意到产生新解的变换方法决
定了当前新解的邻域结构,
因而对冷却进度表的选取有
一定的影响。
算法对应演示图:
第二步是计算与新解所
对应的目标函数差。
因为目标函数差仅由变
换部分产生,所以目标
函数差的计算最好按增
量计算。事实表明,对
大多数应用而言,这是
计算目标函数差的最快
方法。
算法对应演示图:
第三步是判断新解是否被
接受。
判断的依据是一个接受准
则,最常用的接受准则是
Metropolis准则: 若
Δt′<0则接受S′作为新
的当前解S,否则以概率
exp(-Δt′/T)接受S′作
为新的当前解S。
算法对应演示图:
第四步是当新解被确定接受
时,用新解代替当前解。
这只需将当前解中对应于产
生新解时的变换部分予以实
现,同时修正目标函数值即
可。此时,当前解实现了一
次迭代。可在此基础上开始
下一轮试验。而当新解被判
定为舍弃时,则在原当前解
的基础上继续下一轮试验。
模拟退火算法参数的选择:
冷却进度表
我们称调整模拟退火法的一系列重要参数为冷却进度表。它控
制参数T的初值及其衰减函数,对应的MARKOV链长度和停止条
件,非常重要。
一个冷却进度表应当规定下述参数:
1.控制参数t的初值0 ;
2.控制参数t的衰减函数;
3.马尔可夫链的长度 。(即每一次随机游走过程,要迭代
多少次,才能趋于一个准平衡分布,即一个局部收敛解位置)
4.结束条件的选择
• 有效的冷却进度表判据:
一.算法的收敛:主要取决于衰减函数和马
可夫链的长度及停止准则的选择。
二.算法的实验性能:最终解的质量和CPU的
时间。
参数的选取:
一)控制参数初值0 的选取
一般要求初始值 0 的值要充分大,即一开始即处于高温状态,
且Metropolis的接收率约为1。
(1) 均匀抽样一组状态,以各状态目标值的方差为初温。
(2) 随机产生一组状态,确定两两状态间的最大目标值差
|Δmax|,然后依据差值,利用一定的函数确定初温。比如,
0 =-Δmax/pr ,其中pr为初始接受概率。
二)衰减函数的选取
• 衰减函数用于控制温度的退火速度,一个常用的函数为:
T(n + 1) = K*T(n),其中K是一个非常接近于1的常数。
模拟退火算法的全局搜索性能也与退火速度密切相关。一般
来说,同一温度下的“充分”搜索(退火)是相当必要的,但
这需要计算时间。实际应用中,要针对具体问题的性质和特
征设置合理的退火平衡条件。
三)马可夫链长度L的选取
在衰减参数T的衰减函数已选定的前提下,L应选得在控制参
数的每一取值上都能恢复准平衡。
四)终止条件
有很多种终止条件的选择,各种不同的条件对算法
的性能和解的质量有很大影响,我们只介绍一个常
用的终止条件。即上一个最优解与最新的一个最优
解的之差小于某个容差,即可停止此次马尔可夫链
的迭代。
模拟退火算法伪代码
•
代码
•
•
•
•
•
•
•
•
•
•
•
/*
* J(y):在状态y时的评价函数值
* Y(i):表示当前状态
* Y(i+1):表示新的状态
* r: 用于控制降温的快慢
* T: 系统的温度,系统初始应该要处于一个高温的状态
* T_min :温度的下限,若温度T达到T_min,则停止搜索
*/
while( T > T_min )
{
dE = J( Y(i+1) ) - J( Y(i) ) ;
•
•
•
•
•
•
•
•
•
•
•
if ( dE >=0 ) //表达移动后得到更优解,则总是接受移动
Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
else
{
// 函数exp( dE/T )的取值范围是(0,1) ,dE/T越大,则exp( dE/T )也
if ( exp( dE/T ) > random( 0 , 1 ) )
Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
}
T = r * T ; //降温退火 ,0<r<1 。r越大,降温越慢;r越小,降温越快
/*
* 若r过大,则搜索到全局最优解的可能会较高,但搜索的过程也就较长。若r过小,则搜索的过程会很快,但最终可能会达到一个局部
最优值
*/
i ++ ;
}
•
•
•
使用模拟退火算法解决旅行商问题
• 旅行商问题,即TSP问题(Travelling Salesman Problem)是数学领
域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选
择所要走的路径,路经的限制是每个城市只能拜访一次,而且最后要
回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路
径之中的最小值。
• 使用模拟退火算法可以比较快的求出TSP的
一条近似最优路径。
• 解空间:解空间S是遍访每个城市恰好一次的所有路经,
解可以表示为{w1,w2 ,……, wn},w1, ……, wn是
1,2,……,n的一个排列,表明w1城市出发,依次经过
w2, ……, wn城市,再返回w1城市。初始解可选为
(1,……, n)。
• 目标函数:目标函数为访问所有城市的路径总长度。
• 我们要求的最优路径为目标函数为最小值时对应的路径。
• 新路径的产生:
随机产生1和n之间的两相异数k和m,不妨假设k<m,
则将原路径:
(w1,w2,…,wk,wk+1,…,wm,wm+1,…,wn)
变为新路径:
(w1,w2,…,wm,wk+1,…,wk,wm+1,…,wn)上述变换方
法就是将k和m对应的两个城市在路径序列中交换位
置。
• 模拟退火算法是一种随机算法,并不一定
能找到全局的最优解,可以比较快的找到
问题的近似最优解。 如果参数设置得当,
模拟退火算法搜索效率比穷举法要高。
• 优点:计算过程简单,通用,鲁棒性强,
适用于并行处理,可用于求解复杂的非线
性优化问题。
• 缺点:收敛速度慢,执行时间长,算法性
能与初始值有关及参数敏感等缺点
• 经典模拟退火算法的缺点:
(1)如果降温过程足够缓慢,多得到的解的性
能会比较好,但与此相对的
是收敛速度太慢;
(2)如果降温过程过快,很可能得不到全局最
优解。
模拟退火算法的改进:
(1) 设计合适的状态产生函数,使其根据搜索进程的
需要表现出状态的全空间分散性或局部区域性。
(2) 设计高效的退火策略。
(3) 避免状态的迂回搜索。
(4) 采用并行搜索结构。
(5) 为避免陷入局部极小,改进对温度的控制方式。
(6) 选择合适的初始状态。
(7) 设计合适的算法终止准则。
也可通过增加某些环节而实现对模拟退火算法的改进。主要的
改进方式包括:
(1) 增加升温或重升温过程。在算法进程的适当时机,将温度适当提
高,从而可激活各状态的接受概率,以调整搜索进程中的当前状态,避免
算法在局部极小解处停滞不前。
(2) 增加记忆功能。为避免搜索过程中由于执行概率接受环节而遗失
当前遇到的最优解,可通过增加存储环节,将一些在这之前好的态记忆下
来。
(3) 增加补充搜索过程。即在退火过程结束后,以搜索到的最优解为初始
状态,再次执行模拟退火过程或局部性搜索。
(4) 对每一当前状态,采用多次搜索策略,以概率接受区域内的最优状态,
而非标准SA的单次比较方式。
(5) 结合其他搜索机制的算法,如遗传算法、混沌搜索等。
(6)上述各方法的综合应用。
Thanks!

similar documents