遗传算法(Genetic Algorithm)
这篇博客记录自己学习遗传算法的心得。
引入
关于遗传算法,在知乎的问题如何通俗易懂地解释遗传算法?有什么例子?是一个很好的资料,介绍了很多很有趣的例子。
我第一次对遗传算法感兴趣是听了卓老板的一个介绍复杂系统的音频节目,这个节目引用了《复杂》这本书中的关于遗传算法的例子。即一个吃豆人的例子,知乎也有提到。很有意思,也很有启发性,于是想研究研究代码,顺带做个总结。
来自遗传学的启发
看看遗传算法用到了哪些来自遗传学的启发:
- 达尔文的“自然选择”:即优胜劣汰,适应环境的个体可以繁衍后代,而不适应环境的个体不能繁衍后代;
- “交叉”:子代的基因一半来自父亲,一半来自母亲;
- “基因突变”:子代的基因在继承父母的基因的基础上会有一定的概率发生突变。
遗传算法介绍
遗传算法的输入包括两个部分:
候选程序群体和适应性函数
- 候选程序群体 也就是“基因”,这个概念需要好好理解。它可以表示成位/数字或符号组成的字符串。一般来说,它代表“环境状态”–>“反应动作”的映射,也就是代表不同的情况下,它该做什么动作。这个概念还有很多玄机,后面继续谈。
- 适应性函数 也就是“大自然”,可以理解成评价函数,评价某个个体对某个特定环境的适应程度,适应程度高的个体可以繁殖后代。
GA算法:
- 生成候选方案的初始群体。生成初始群体最简单的办法就是随机生成大量“个体”(个体基因)。
- 计算当前群体中各个个体的适应度。
- 选择一定数量适应度最高的个体作为下一代的父母。
- 将选出的父母进行配对。用父母进行重组产生出后代,伴有一定的随机突变概率,后代加入形成新一代群体。选出的父母不断产生后代,直到新的群体数量达到上限(即与初始群体数量一样)。新的群体成为当前群体。
- 转到第2步。
遗传算法的应用
- 通用电气将GA用于飞行器的部分自动化设计;
- 洛斯阿拉莫斯国家实验室用GA分析卫星图像;
- 约翰迪尔(John Deere)公司将GA用于自动化生产线的调度;
- 德州仪器(Texas Instruments)则用GA来设计计算机芯片。
举例
例子1:垃圾清扫机器人
例子采用《复杂》中的吃豆人,也就是易拉罐清扫机器人————罗比。
罗比是图中的机器人,它的任务,是打扫10×10方格中随机出现的易拉罐。
每次清扫工作,罗比可以执行200个动作。罗比只能看见当前的格子和相邻4个格子的情况。
每个格子只有3种情况:
- 空格子
- 有易拉罐的格子
- 墙。
动作可以是以下7种:
- 往北移动
- 往南移动
- 往东移动
- 往西移动
- 随机移动
- 不动
- 收集罐子。
动作对应的奖励和惩罚:
- 收集一个罐子,+10分;
- 进行收集动作,但格子中没有罐子,-1分;
- 撞到墙-5分,回到原来的格子。
显然,罗比尽可能地多收集罐子,别撞墙,没罐子的时候别去捡,得到的分数就最高。
直接写规则好吗?
人工智能早期的“符号学派”,设计一个智能系统通常是基于规则去判断的。
突然想到知乎上一个很搞的问题:如何看待百度无人车,三千多个场景,一万多个if?。
这些说白了,这些规则,就是我上文说的“环境状态”–>“反应动作”的映射。
回到罗比的问题,如果我们的罗比是一个没有“记忆”的机器人,也就是说,它只能应用的信息是当前所处格子和其他相邻的四个格子的状态,却不知道它上一步走的时候那5个格子的状态。
这样问题就会大大简化,场景的个数就变成了3的5次方(5个格子,每个格子可能有3中状态),也就是243种情况。
没有问题,这样写规则也能解决。但,这样实在是费时费力,这里还只考虑罗比没有记忆呢,如果罗比能记住前面走过的一步,那规则就是$243^2$条了,那已经没法写了,更别说记住前面两步,三步了。
好,既然这样,让罗比试试遗传算法:
- 生成初始群体。初始群体有200个随机个体(策略)。每个基因是一个介于0和6之间的数字,代表一次动作(0=向北移动,1=向南移动,2=向东移动,3=向西移动,4=不动,5=捡拾罐子,6=随机移动)。在初始群体中,基因都随机设定。程序中用一个伪随机数发生器来进行各种随机选择。重复后面的步骤1000次。
- 计算群体中每个个体的适应度。在我的程序中,是通过让罗比执行100次不同的清扫任务来确定策略的适应度。每次将罗比置于位置(0,0),随机撒一些易拉罐(每个格子至多1个易拉罐,格子有易拉罐的概率是50%)。然后让罗比根据策略在每次任务中执行200个动作。罗比的得分就是策略执行各任务的分数。策略的适应度是执行100次任务的平均得分,每次的罐子分布都不一样。
- 进化。让当前群体进化,产生出下一代群体。即重复以下步骤,直到新群体有200个个体。
作者自己编写的规则,平均得分是346,完美的得分是500(一共50个罐子),GA结果是483,相当不错。
讲到这里,还没有说遗传算法最神奇的一点:那就是,根据遗传算法得到的规则,单个拿出来看,可能人们很难理解。
这其实很好理解,拿基因来说吧,如果让你设计一个“完美”的人,你可能会想,“我要设计一个大眼睛的基因,我还要设计一个高鼻梁的基因”,但是局部可能都是比较不错的策略,综合在一起的结果,可能没那么好。也许真正看上去完美的人,眼睛不是最大,鼻梁也不是最高,但这个人整体看上去就是很好看。
难怪美国国家航空航天局(NASA)的遗传算法专家罗恩(Jason Lohn)曾这样说:“遗传算法是探索设计死角的伟大工具。”
例子2:求解函数
求解函数$f(x) = x + 10×sin(5×x) + 7*cos(4×x)$ 在区间[0,9]的最大值。(来自知乎)
如何应用遗传算法求解这样的最优化问题呢?
还是先解决GA算法的两个输入:
- 候选程序群体是什么?适应性函数是什么?
- 适应性函数:比较容易想到,本身就是求解最大值,函数本身就可以当做适应性函数。
- 候选程序群体:题目给出了探索的解的空间,在0-9之间比如划分成90000,即精确到4位小数;
$2^{16}<90000<2^{17}$,需要17位二进制数来表示这些解。换句话说,一个解的编码就是一个17位的二进制串。
代码实现:
1 |
|
1 | 7.85672650701 |
例子3:用n个三角形作画
GA画画,这些同学脑洞开得很大,很有趣~
上传一张图片,GA自己学习用三角形组合出原图。