粒子群算法（PSO）

2019-08-09 00:00:00 算法粒子 PSO

这几天看书的时候看到一个算法，叫粒子群算法，这个算法挺有意思的，下面说说我个人的理解：

　　粒子群算法（PSO）是一种进化算法，是一种求得近似最优解的算法，这种算法的时间复杂度可能会达到O(n!)，得到的结果不一定是最优解，往往已经很接近最优解了。最早是Kenny 和 Eberhart于1995年提出的，算法的参数配置少，易于应用，理解起来也很简单。实现步骤如下：

　　（1）初始化所有的粒子，粒子的位置随机生成，计算每个粒子当前适应度，并将此设置为当前粒子的个体最优解（记为pBest）；

　　（2）所有粒子将自己的个体最优值发给管理者Master，管理者Master接到所有粒子的信息后，筛选出全局最优解（记为gBest）；

　　（3）Master将gBest通知所有粒子，所有粒子知道了全局最优解的位置；

　　（4）所有粒子根据自己的个体最优解和全局最优解，更新自己的速度，有了速度以后更新自己的位置。

　　　　　　v_k+1 = c₀ × rand() × v_k + c₁ × rand() × (pBest_k – x_k) + c₂ × rand() × (gBest_k – x_k)

　　　　　　 rand() 函数会产生一个(0,1)的随机数。 c₀ = 1、 c₁ = 2、 c₂ = 2 ，k表示进化的代数。v_k表示当前速度_，pBest_k_和gBest_k分别表示个体最优解和全局最优解。当然每个维度上的速度分量可以限定一个最大值。

　　（5）如果粒子产生了新的个体最优解，则发送给Master，再循环步骤（2）。

可以看出每个粒子的计算有很大的随机性，但是我们可以启用大量的粒子进行计算，因此在统计学意义上是稳定的。

下面出到这个算法的题：

　　假设有400万元，要求4年内用完，如果第一年使用x万元，则可以得到的收益是√x万元（收益不再使用），当年不用的资金存入银行，年利率10%，尝试指定资金使用计划，使得4年收益之和最大。

　　很明显，不同方案有不同结果，差异也很大，例如第一年就把400万投资，那么收益就是√400 = 20万；如果前三年不用，存入银行，第四年再把本金和利息全部拿出来，总收益是√400×1.1³ = 23.07 万元，优于第一个方案。

　　如果一个线程一个方案的话势必产生大量的线程，Akka框架的Actor模型正好适合这个，因为每个Actor可以共享同一个线程，这样不用产生大量的线程并且保证了大量的粒子。我们可以使用Actor来模拟整个粒子计算的场景。

　　首先，新建pBest和gBest消息类型，用于多个Actor之间传递个体最优解和全局最优解。

《粒子群算法（PSO）》

 1 /**
 2 * 全局最优解
 3 */
 4 public final class GBestMsg{
 5   final PsoValue value;
 6   public GBestMsg(PsoValue v){
 7      value = v;
 8   }
 9   public PsoValue getValue(){
10      return value;
11   }
12 }
13 /**
14 * 个体最优解
15 */
16 public final class PBestMsg{
17   final PsoValue value;
18   public PBestMsg(PsoValue v){
19      value = v;
20   }
21   public PsoValue getValue(){
22      return value;
23   }
24   public String toString(){
25      return value.toString();
26   }
27 }

View Code

上面最优解中有个类是PsoValue，主要包含两个信息，一是投资规划方案，就是每一年分别需要投资多少钱；二是这个投资方案的总收益

public final class PsoValue{
  final double value;
  final List<Double> x;
  public PsoValue(double v,List<Double> x){
    value = v;
    List<Double> b = new ArrayList<Double>(5);
    v.addAll(x);
    this.x = Collections.unmodifiableList(b);
  }  
  
  public double getValue(){
    return value;
  }

  public List<Double> getX(){
    return x;
  }

  public  String toString(){
    StringBuffer sb = new StringBuffer();
  sb.append("value:").append(value).append("\n").append(x.toString());
    return sb.toString();
  }
}

上述代码的数组x中，x[1]、x[2]、x[3]、x[4]分别表示第一年、第二年、第三年、第四年的投资额，忽略x[0]，成员变量value表示这组投资方案的收益值。根据题目的需求，x与value之间的关系可以用如下代码表示。投资收益额 = √x₁+√x₂+√x₃+√x₄。

public class Fitness{
  public static double fitness(List<Double> x){
    double sum = 0;
    for(int i =1; i<x.size();i++){
      sum += Math.sqrt(x.get(i));
    }
    return sum;
  }
}

下面就是实现我们的粒子了，我们就叫他Bird吧，定义以下成员变量和方法如下：

Public class Bird extends UntypedActor{
  private final LoggingAdapter log = Logging.getLogger(getContext().system(),this);
  //个人最优解
  private PsoValue pBest = null;
  //全局最优解
  private PsoValue gBest = null;
  //粒子在各个维度上的速度
  private List<Double> velocity = new ArrayList<Double>(5);
  //投资方案
  private List<Double> x = new ArrayList<Double>(5);
  private Random r = new Random();

  /**
    初始化粒子
   */
  @Override
  public void preStart(){
    for(int i = 0;i<5;i++){
      velocity.add(Double.NEGATIVE_INFINITY);
      x.add(Double.NEGATIVE_INFINITY);
   }
    x.set(1,(double)x.nextInt(401));
    double max = 440-1.1*x.get(1);
    if(max<0)
      max=0;
    x.set(2,r.nextDouble()*max);
    max = 484 - 1.21*x.get(1)-1.1*x.get(2);
    if(max<0)
      max=0;
    x.set(3,r.nextDouble()*max);
    max = 532.4-1.331*x.get(1)-1.21*x.get(2)-1.1*x.get(3）;
    if(max<0)
      max=0;
    x.set(4,r.nextDouble()*max);
    doubel newFit = Fitness.fitness(x);
    pBest = new PsoValue(newFit,x);
    PBestMsg pBestMsg = new PBestMsg(pBest);
    ActorSelection selection = getContext().actorSelection("/user/masterbird");
    selection.tell(pBestMsg,getSelf());
  }

  /**
    接受全局最优解
   */
  @Override
  public void onReceive(Object msg){
    if(msg instanceof GBestMsg){
      gBest = ((GBestMsg)msg).getValue();
      for(int i =1;i<5;i++){
        updateVelocity(i);
      }
      for(int i =1;i<5;i++){
        updateX(i);
      }
      validateX();
      double newFit = Fitness.fitness();
      if(newFile>pBest.value){
        pBest=new PsoValue(newFit,x);
        PBestMsg pBestMsg  = new PBestMsg(pBest);
        getSender().tell(pBestMsg,getSelf());
      }
    }
    else{
      unhandled(msg);
    }
  }

  /**
    更新偏移量
   */

public double updateVelocity(int i){
    double v = Math.random()*velocity.get(i)
　　　　+2*Math.random()*(pBest.getX().get(i)-x.get(i))
　　　　+2*Math.random()*(gBest.getX().get(i)-x.get(i));
　　 v = v>0?Math.min(v,5):Math.max(v,-5);
    velocity.set(i,v);
　　 return v;
  }

  public double update(int i){
    double newX = x.get(i)+velocity.get(i);
    x.set(i,newX);
    return newX;
  }

  public void validateX(){
    if(x.get(i)>400){
      x.set(1,(double) r.nextInt(401));
    }
　　 double max = 440-1.1*x.get(1);
　　 if(x.get(2)>max || x.get(2)<0){
       x.set(2,r.nextDouble()*max);
     }
     max = 484 - 1.21*x.get(1)-1.1*x.get(2);

     if(x.get(3)>max || x.get(3)<0){
       x.set(3,r.nextDouble()*max);
     }
     max = 532.4-1.331*x.get(1)-1.21*x.get(2)-1.1*x.get(3）;

     if(x.get(4)>max || x.get(4)<0){
       x.set(4,r.nextDouble()*max);
     }

  }

}

当一个粒子被创建需要初始化粒子当前位置，粒子的每个位置代码一个投资方案，上述代码的preStart()方法就是初始化粒子，本题中投资额是有限制的，例如第一年的投资额不能超过400万元，而第二年的投资上限就是440万，粒子初始化位置后，会计算一个适应度也就是本题目中的投资收益额。Master计算出全局最优解后会将全局最优解发送给每一个粒子，粒子根据全局最优解更新自己的运行速度就是本题目中是偏移量，以及当前位置。如果粒子跑偏了就要重新随机化，也就是需要校验功能。

此外还有个MasterBird用于管理和通知全局的最优解。

public  calss MasterBird extends UntypedActor{
  private final LoggingAdapter log = Logging.getLogger(getContext().system(),this);
  private PsoValue gBest = null;

  @Override
  public void onReceive(Object msg){
    if(msg instanceof PBestMsg){
      PsoValue pBest = ((PBestMsg) msg).getValue();
      if(gBest == null || gBest .value < pBest.value){
　　　　　 System.out.println(msg+"\n");
         gBest = pBest;
         ActorSelection selection = this.getContext().actorSelection("user/bird_");
         selection.tell(new GBestMsg(gBest),this.getSelf());
      }
    }else{
         unhandle(msg);
    }
  }

}

上述代码定义了MasterBird，当他收到一个个体的最优解时，会将其与全局最优解进行比较，如果产生了新的最优解，就会更新这个全局最优解，并且通知各个粒子。

下面看看主函数了：

public class PSOMain{
   public static final int BIRD_COUNT = 100000;
   public static void main(){
      ActorSystem system = ActorSystem.create("psoSystem",ConfigFactory.load("samplehell.conf"));
      system.actorOf(Props.create(MasterBird.class),"masterbird");
      for(int i=0;i<BIRD_COUNT;i++){
        system.actorOf(Props.create(Bird.class),"bird_"+i)
      }
   }

}

上面代码定义了10万个粒子，创建了一个MasterBird和10万个bird。执行上述代码，运行一小段时间就可以得到题目中的答案了。

由于粒子群算法的随机性，每次执行结果可能并不是一样的，这就意味着有时候可能得到更好的，有时候可能会差一些，但相差不会太远的。

相关文章