読んだ論文メモ(2013/05/05-2013/05/11):カードゲーム関連
JM Font, T Mahlmann, D Manrique and J Togelius (2013), "Towards the Automatic Generation of Card Games through Grammar-Guided Genetic Programming"
- Card Game Description Languageによって表現されたカードゲームをGrammar-Guided Genetic Programming(GGGP)により進化
- Card Game Description Languageはテキサス・ホールデム,ブラックジャック,UNO等を表現できる
- 各個体に対して一定回数のプレイアウトをし評価を行う
- 一度も正しく終了しなかった個体,引き分けが20%より多い個体,ルールが複雑すぎる個体は直ちに除去
- プレイヤ間の勝利数の差,ゲームが終了するまでのターン数の平均,どのプレイヤも合法手を持たないターンの数の平均,ランダムプレイヤとMCTSプレイヤの性能差の4つを用いて適合度を計算
- 得られたゲームは人間がバランスが取れており,スキル要素もあるが,人間がプレイして面白いものとは言えない
PL Cowling, CD Ward, EJ Powley (2012), "Ensemble determinization in Monte Carlo tree search for the imperfect information card game Magic: The Gathering"
T Mahlmann, J Togelius and GN Yannakakis (2012), "Evolving Card Sets Towards Balancing Dominion"
- ドミニオンの王国カード10枚の組み合わせを評価し,バランスのとれた組み合わせを進化計算により獲得
- 3種類のプレイヤを用意
- vDomエンジンが提供するEarlとDrew
- NeuroEvolution of Augmenting Topologies(NEAT)を使用し,購入するカードの選択とプレイするアクションカードの選択のための2つのArtificial Neural Network(ANN)を学習したプレイヤ
- 基本セットのカードのみ使用
- 2種類の適合度関数を提案し評価
- プレイヤの技術の差に基づいた適合度:プレイヤ間の得点差の大きさ(大きいほどよい)
- 異なるプレイヤ間で評価(3通りの組み合わせそれぞれにつき別々に進化させる)
- ゲーム中の展開に基づいた適合度:1ゲーム中におけるプレイヤの優位の入れ替わりの回数(多いほどよい)と最後の優位の入れ替わり(遅いほどよい)の組み合わせ
- 同じプレイヤ間で評価(3プレイヤそれぞれにつき別々に進化させる)
- 優位の推定のためのANNはカードセットごとに学習
- プレイヤの技術の差に基づいた適合度:プレイヤ間の得点差の大きさ(大きいほどよい)
- 各適合度関数によってカードセットを進化させた場合に選ばれやすいカードを分析