論文メモ(2013/04/28-2013/05/04):複雑ネットワーク,進化計算,ゲーム
B. Georgeot and O. Giraud (2012), "The game of go as a complex network"
Carlos A. Coello Coello (2001), "Theoretical and numerical constraint-handling techniques used with evolutionary algorithms: a survey of the state of the art"
- 進化計算において解の制約をどう扱うか
- 5つのクラスに分類
- Penalty functions:充足されない制約の数や程度に応じて適合度を減少させる
- Special representations and operators:infeasibleな個体が生じないような表現方法やオペレータを用いる
- Repair algorithms:infeasibleな個体をfeasibleな個体に変換する(適合度を計算するときだけrepairする or 個体を永久的に置き換えてしまう)
- Separation of objectives and constraints:目的関数と制約を組み合わせず別々に扱う
- Hybrid methods:他の最適化技術と組み合わせる
- 各手法について長所短所を考察し,さらに一部の手法については実験により評価
- 最も単純なDeath penalty(制約を1つでも満たさない個体の適合度は0にする)でも,問題についての知識がない場合はそれほど悪くない
Joseph Reisinger, Erkin Bahçeci, Igor Karpov and Risto Miikkulainen (2007), "Coevolving Strategies for General Game Playing"
- ミニマックス探索に用いる評価関数をNeural Networkで表現,NeuroEvolution of Augmenting Topologies(NEAT)で進化
- Neural Networkの入力の数は40(ランダムな射影とあるが詳細は不明),出力の数は1(評価値)
- パレート最適な解への単調な進化を保証するCovering Competitive Algorithm(CCA)を利用
- 5ゲーム中4ゲームでパフォーマンス向上,1ゲームでは低下
- 1-plyで学習した評価関数は2-ply以上の探索ではランダムに対するパフォーマンスが落ち,スケールしない
- disengagement(一方の集団が強すぎるせいで他方の集団の個体間に適合度の差が生まれず,個体を適切に選べなくなるという,共進化アルゴリズムに見られる問題)が一部のゲームで生じる
- nnrg.hazelは2006年のコンペティションで6位